Reasoning Web 2013論文集より

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術   AI学会論文    知識情報処理技術   AI学会論文を集めて     推論技術

前回はReasoning Web2012について述べた。今回は、2013年7月30日から8月2日までドイツのマンハイムで開催された第9回Reasoning Web Summer School 2013について述べる。

Reasoning Web Summer Schoolシリーズは、長年にわたり、Webのための推論手法という活発な分野における最高の教育イベントとして、若手からベテランの研究者までが参加している。これまでの開催地は、マルタ(2005年)、リスボン(2006年)、ドレスデン(2007年、2010年)、ベニス(2008年)、ブレッサノン-ブリクセン(2009年)、ゴールウェイ(2011年)、そしてウィーン(2012年)となる。

2013年版は、マンハイム大学のデータ・ウェブサイエンス研究グループ(http://dws.informatik.uni-mannheim.de)が主催した。Heiner StuckenschmidtとChris Bizerが共同主宰するこのグループは、現在4名の教授、5名のポスドク研究員、15名の博士課程学生で構成されている。情報抽出と統合、データ管理、推論とマイニング、ユーザーとのデータ交換など、Webデータのライフサイクル全体をカバーする同グループは、今回のサマースクールの開催に最適な場所となる。また、DBpediaやオントロジーアライメント評価などの関連するコミュニティ活動でも知られており、主に情報統合や情報検索のための非標準推論、並列化によるスケーラブル推論、論理推論と確率推論の組み合わせなどに取り組み、Web推論の分野で強い背景を持っている。

今回のサマースクールは、Web Reasoning and Rule Systems (RR)国際会議と併催された。さらに、この2つのイベントの直前には、7月22日に第2回OWL Reasoner Evaluation Workshop (ORE 2013)、7月23日から26日にかけて第26回国際記述論理ワークショップ (DL 2013) がドイツ・ウルムで開催された。

2013年のサマースクールでは、RDFのような拡張性のある軽量な形式から、記述論理に基づくより表現力の高い論理言語まで、Web推論のさまざまな側面を取り上げられた。また、アンサーセットプログラミングやオントロジーに基づくデータアクセスで用いられる基礎的な推論技術や、地理空間情報の取り扱いや推論駆動型情報抽出・統合などの新しいトピックも取り上げられた。

講義に付随するスライドとすべてのチュートリアルの教材は、サマースクールのウェブサイト(http://reasoningweb.org/2013/)で公開されている。

以下に詳細の内容について述べる。

With Linked Data, a very pragmatic approach towards achieving the vision of the Semantic Web has gained some traction in the last years. The term Linked Data refers to a set of best practices for publishing and interlinking structured data on the Web. While many standards, methods and technologies developed within by the Semantic Web community are applicable for Linked Data, there are also a number of specific characteristics of Linked Data, which have to be considered. In this article we introduce the main concepts of Linked Data. We present an overview of the Linked Data lifecycle and discuss individual approaches as well as the state-of-the-art with regard to extraction, authoring, link- ing, enrichment as well as quality of Linked Data. We conclude the chapter with a discussion of issues, limitations and further research and development challenges of Linked Data. This article is an updated version of a similar lecture given at Reasoning Web Summer School 2011.

Linked Dataは、Webデータの大部分が、構造化されたクエリに答えることができる、一つの大きなインターリンクされたRDFデータベースとして使用できるようになることを約束している。この講義では、RDFスキーマ(RDFS)とウェブオントロジー言語(OWL)を用いた推論が、Linked Dataに対するクエリに対してより完全な答えを得るためにどのように役立つかを紹介する。まず、RDFSとOWLの機能がどの程度ウェブで採用されているかを見ていきます。次に、Linked Data上のクエリに答えるための2つのハイレベルなアーキテクチャを紹介し、これらが(軽量な)RDFSとOWL推論によってどのように強化されるかを概説し、直面する主な課題を列挙して、これらの課題に対処するための実用的かつ理論的トレードオフを行う推論方法について議論する。最後に、RDFSとOWLで十分かどうかを問い、これらの標準の範囲を超えているが、いくつかの異種ソースからのリンクデータを統合するときにしばしば重要である数値推論方法についても議論する。

記述論理(DL)は、標準的なウェブオントロジー言語であるOWL 2の基礎となる論理的な形式主義である。DLは、多くの強力な推論サービスの基礎となる正式な意味論を持っている。本論文では、DL推論サービスに焦点を当て、入門的な文献やコース教材を調査することにより、記述論理の分野における基本的なトピックの概要を提供する。また、研究分野としてのDLに関する歴史的な視点も提供する。

答集合プログラミング(ASP)は論理プログラミング、演繹データベース、 知識表現、非単調推論などの分野から発展し、宣言的問題解決のための柔軟な言語と して機能するようになった。問題解決には表現と推論という2つの主要なタスクがあり、宣言的パラダイムではこれらは明確に分離されている。ASPでは、表現はルールベースの言語を使って行われ、推論はASPソルバーと呼ばれる汎用アルゴリズムの実装を使って行われる。ASPのルールは、閉じた世界の仮定(CWA)や一意名推定(UNA)の変種を含む常識的な原則に従って解釈される。ASPのルールの集まりはASPプログラムと呼ばれ、モデル化された知識を表現する。各ASPプログラムには解答セットのコレクション、または意図されたモデルが関連付けられ、それらはモデル化された問題の解を表す。このコレクションは空であることもあり、モデル化された問題が解を認めないことを意味する。いくつかの推論タスクが存在する。古典的なASPタスクは全ての回答集合を列挙するか、あるいは回答集合が存在するかどうかを決定することであるが、ASPは勇敢あるいは慎重モードでの問合せ回答も可能である。この記事では、歴史的な観点から始まり、コア言語の定義、知識表現のガイドライン、既存のASPソルバーの概要、そしてこの分野における現在の研究トピックのパノラマに続く、この分野の紹介を提供します。

オントロジーに基づくデータアクセス(OBDA)は、新世代の情報システムの重要な要素であると考えられています。OBDAパラダイムでは、オントロジーは(既に存在する)データソースのハイレベルなグローバルスキーマを定義し、ユーザークエリのための語彙を提供します。OBDAシステムは、このようなクエリとオントロジーをデータソースの語彙に書き換え、実際のクエリー評価をリレーショナルデータベース管理システムやデータログエンジンのような適切なクエリー回答システムに委ねます。本章では、W3C標準のWeb Ontology Language OWL2の3つのプロファイルの1つであるオントロジー言語OWL 2 QLとリレーショナルデータベースによるOBDAに主に焦点を当てるが、他の言語についても議論する。また、OBDAシステムの様々なアーキテクチャや、OBDAシステム「Ontop」の概要についても述べる。

研究分野としての地理空間セマンティクスは、地理データの公開、検索、再利用、統合の方法、概念モデルによる地理データの記述方法、データ構造の上で非互換性のリスクを低減するための正式仕様の開発方法などを研究しています。ジオデータは非常に異質であり、定性的なインタビューやテーマ別地図から、衛星画像や複雑なシミュレーションまで多岐にわたる。このため、オントロジー、セマンティックアノテーション、推論サポートは、Geospatial Semantic Webに向けた不可欠な要素である。本論文では、主な研究課題、最近の研究成果、および主要な文献の概要を紹介する。

この講義ノートでは、いくつかの最先端の大規模情報抽出プロジェクトの概要を説明します。その結果、これらのプロジェクトはセマンティックウェブコミュニティにおける現在の研究活動に関連している。これらの情報抽出プロジェクトのために開発された学習アルゴリズムの大部分は、Wikipediaや大規模なウェブコーパスの語彙および構文処理に基づいている。処理されるデータの大きさと、それに伴う推論問題の難解さにより、既存の知識表現フォーマリズムはしばしばこのタスクに不適切である。本講演では、統計的言語処理とルールベースのアプローチをより近づけるために、扱いやすい論理モデルと確率モデルを組み合わせた最近の進歩について紹介する。本講演では、不確実性に基づくデータ駆動型研究と、ルールに基づくスキーマ駆動型研究とが出会うことで、多くの相乗効果と研究課題が生まれることを参加者に納得していただきたいと考えている。また、確率的推論が非常に大きな問題に対応できるようにするための、理論的および実践的な進歩についても説明する。

次回はReasoning Web 2014について述べる。

コメント

  1. […] 次回はReasoning Web 2013について述べる。 […]

タイトルとURLをコピーしました