Reasoning Web2016 論文集より

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術   AI学会論文    知識情報処理技術   AI学会論文を集めて     推論技術

前回はReasoning Web2015について述べた。今回は2016年9月5日から9日まで英国アバディーンで開かれた第12回Reasoning Webサマースクール(RW2016)について述べる。

内容としては知識グラフ、リンクデータ、セマンティクス、ファジーRDF、OWL知識ベースの構築とクエリのための論理的基礎をカバーしている。

以下に詳細について述べる。

本章では、知識グラフ構築過程における著者の意図の理解に関するいくつかの最新技術を紹介する。さらに、本書の概要と、ナレッジグラフの歴史と概念について簡単に紹介する。

明示的著者意図と暗黙的著者意図の概念を紹介し、それぞれのタイプの著者意図を理解するためのいくつかのアプローチについて述べ、そうした理解が推論に基づくテスト駆動型知識グラフ構築においてどのように利用され、一括編集、効率的推論、状況認識の向上のためのガイドラインの設計に役立てられるかを示す。また、テスト駆動型知識グラフ構築のオントロジー推論への含意を広く議論する。

あるオントロジーを、より単純な別のオントロジーに安全に置き換えることができるかどうかは、多くのオントロジーエンジニアリングとメンテナンスのタスクにとって基本的な問題である。例えば、オントロジーのバージョニング、オントロジーのモジュール化、忘却、知識交換などの基礎となるものである。安全な置き換えが何を意味するかは、オントロジーの意図する用途に依存する。例えば、オントロジーがデータの問い合わせに使われる場合、オントロジーを介した問い合わせに対する答えは、関連するすべてのデータセットで同じでなければならない。対照的に、オントロジーが概念推論のために使われる場合、概念表現間の包含は一致しなければならない。このことは、クエリの不可分性や概念の不可分性など、オントロジーの不可分性に関する様々な概念を生み出し、これらは対応する保存的拡張の概念を一般化する。我々は、記述論理オントロジーの文脈における分離不可能性の様々な概念に関する結果を調査し、その応用、有用なモデル理論的特徴、2つのオントロジーが分離不可能であるかどうかを決定するアルゴリズム(場合によっては、分離不可能な場合にそれらの間の差を計算)、およびこの問題の計算複雑性を議論する。

グラフデータベースとリレーショナルデータベースの重要な違いの1つは、グラフではナビゲーションクエリに関心が高いことである。その結果、グラフデータベースシステムは、これらの問い合わせに効率的に答えるように特別に設計されており、複雑なナビゲーションパターンを表現できる問い合わせ言語に関する幅広い研究が行われている。グラフクエリにナビゲーションを追加する最も一般的な方法は、基本的なパターンマッチング言語から始めて、正規表現に基づくナビゲーションプリミティブで補強することである。例えば、ソーシャルネットワークにおける友人の友人関係は、(friend)+という表現で表され、友人関係で結ばれたノードのパスを検索することができる。この式をグラフパターンに追加することで、例えば、共通の友人関係を持つノードA、B、Cを全て取得することができる。しかし、ナビゲーションをプリミティブの集合に分離することの欠点を軽減するために、最近、ナビゲーションとパターンマッチングを本質的に統合する言語を研究する努力がなされているのを目にした。この言語では、パターンマッチと再帰を任意にネストすることができ、より表現力豊かなナビゲーションクエリを提供することができる。この論文では、グラフのための最も一般的なナビゲーションプリミティブをレビューし、これらのプリミティブをDatalogにどのように埋め込むことができるかを説明します。そして、これらのプリミティブを表現するのに十分な表現力を持ち、かつ、実際に使用可能な問い合わせ言語を得るために、Datalogを制限する現在の取り組みを紹介します。基本的なグラフモデルと、セマンティックウェブの基礎となるより一般的なRDFフォーマットの両方において、これがどのように機能するかを説明する。

数百億から数千億の論理的記述を持つLinked Open Data (LOD) は、これまでに構築された最大の知識ベースの一つである。そのため、様々な分野のアプリケーションのための巨大な情報源であると同時に、その規模から、知識表現と推論、異種性、複雑性の理想的なテストベッドでもあります。しかし、このユニークなリソースを利用することは、データ収集、品質、アクセス性、拡張性、可用性、検索性など多くの問題により、過去に不可能に近いことが証明されています。LOD Laundromat と LOD Lab は、自動的にデータをクローリング、クリーニング、インデックス作成、分析、統一された方法で再公開することにより、これらの問題を体系的に解決する最近のインフラストラクチャです。LOD Labは、シンプルなツール群により、研究者が何十万ものデータドキュメントをシームレスに照会、アクセス、分析、操作することを可能にし、例えば、コンテンツとメタデータに基づく何十万もの(おそらく統合された)データセットに対する実験(例えば推論のための)を促進することができます。本章では、この大規模な実験プラットフォームを理想的に利用するために必要な理論的基礎と実践的スキルを提供する。まず、現在のセマンティックウェブデータの利用を困難にしている問題を研究する。また、一般的な解決策を提案し、読者がLODクラウド上で独自の実験を始めるために必要なツールを紹介します。

記述論理(DL)知識ベースへの問い合わせにおいて、知識ベースが矛盾している場合にどのように対処するかが重要な問題となる。実際、TBox(オントロジー)は適切にデバッグされていると考えるのが妥当かもしれませんが、ABox(データ)は一般に非常に大きく、頻繁に修正されるため、エラーが発生する可能性が高くなります。このような状況では標準的なDL意味論は役に立たないので(すべてが矛盾から帰結する)、このようなデータの矛盾がある場合に問い合わせに対して意味のある答えを提供することを目的として、いくつかの代替の矛盾に耐える意味論が提案されている。本章の前半では、あらゆるDL(またはオントロジー言語)に適用可能なこれらの矛盾許容セマンティクスを紹介し、比較する。本章の後半では、DL-LiteファミリーのDLに焦点を当て、これらのセマンティクスの計算特性について既知のものを要約し、主なアルゴリズム技術と既存のシステムの概要を説明する。

本講演の目的は、トリプル言語であるRDF/RDFS、OWL 2ファミリーの概念言語、ルール言語などのセマンティックWeb言語におけるファジー知識の表現と推論に関する詳細かつ自己完結した包括的な技術の現状を提示することである。さらに、それらを、例えば時間的拡張や証明拡張を含む、いわゆるアノテーション領域へどのように一般化できるかを示す。

知識発見は、演繹的(先験的)またはデータ的(後述的)に知識を抽出する方法論に焦点を当てた領域として、データベースや人工知能の分野で主に研究されてきた。論理推論のような演繹的推論では、あらかじめ確立された(ある)知識文から論理的に知識を得るが、データマイニングや学習のような帰納的推論では、最初の情報から一般化して知識を発見する。演繹的推論と帰納的学習は、概念的には異なる視点から知識発見問題に取り組んでいるが、実世界の応用では互いにうまく補完しあう推論技術である。本章では、(i)ボローニャ、ダブリン、マイアミ、リオの各都市における交通機関、(ii)金融における支出最適化という文脈で、機械学習と推論の技術をいかに調和させ統合して大規模問題に対処できるかを紹介する。

次回はReasoning Web2017について述べる。

コメント

  1. […] 次回はReasoning Web2016について述べる。 […]

タイトルとURLをコピーしました