Reasoning Web 2011論文集より

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術   AI学会論文    知識情報処理技術   AI学会論文を集めて     推論技術

前回はReasoning Web2010について述べた。今回は、2011年8月23日~27日にアイルランドのゴールウェイで開催された第7回Reasoning Web Summer School 2011について述べる。

Reasoning Web Summer Schoolは、Web上での推論技術の応用の分野で確立されたイベントであり、既存の研究者の科学的な議論を対象とし、この新しい分野に若い研究者を引きつけるものとなる。マルタ(2005年)、リスボン(2006年)、ドレスデン(2007年、2010年)、ベニス(2008年)、ブレッサノン-ブリクセン(2009年)で開催され成功を収めた後、2011年はアイルランド国立大学ゴールウェイ校のデジタルエンタープライズ研究所(DERI)がホストする西アイルランドに移動して開催されました。今年のサマースクールは、5th International Conference on Web Reasoning and Rule Systems (RR2011)1 と併催することで、研究者、実務者、学生の交流をより一層促進することができた。

2011年のサマースクールでは、「Web of Data」に対する推論の応用を中心に、12の講義を行った。本書の各章は、サマースクールのウェブサイト2 で公開される講義のスライドとともに、教育資料や参考文献を提供するものとなる。本書は、講師陣が提供した優れた概説記事をサマースクールの受講生に提供するだけでなく、一般読者にもWebデータ上の推論に関する様々なトピックの入り口となる一冊を提供できる。

最初の4章では、RDF(Resource Description Framework)とLinked Dataの原理(1章)、OWL(Web Ontology Language)の基礎となる記述論理(2章)、問い合わせ言語SPARQLとOWLとの併用(3章)、効率的でスケーラブルなRDF処理に関連するデータベース基盤(4章)を紹介し、基礎知識を提供することにしている。

これらの基礎に基づき、第5章ではLinked Data上でスケーラブルなOWL推論を行うためのアプローチを紹介し、続く2章ではWeb推論に関連するルールと論理プログラミング技術(第6章)、特にルールベース推論とOWLの組み合わせ(第7章)を紹介する。

第8章では、Web of dataのモデルについて詳しく説明する。第9章では、Webの信頼性管理の重要な問題を議論する。最後の2つの章は、セマンティックウェブのための非標準的な推論方法について継続する。第10章では、ソフトウェア解析にも応用されている帰納的推論手法のSemantic Webへの応用について述べ、第11章では、論理的推論と論理的推論を組み合わせたアプローチについて述べる。また、制約プログラミングと組合せ最適化に関する講義も追加されている。

以下に詳細な内容を示す。

Linked Dataは、セマンティックWebのビジョンを達成するための非常に実用的なアプローチとして、最近大きな注目を集めています。Linked Dataという用語は、ウェブ上で構造化されたデータを公開し、相互にリンクするための一連のベストプラクティスを指します。セマンティックウェブコミュニティで開発された多くの標準、手法、技術はLinked Dataに適用できるが、考慮しなければならないLinked Data特有の特性も数多く存在する。この記事では、Linked Dataの主要なコンセプトを紹介する。また、Linked Dataのライフサイクルの概要を示し、Linked Dataの抽出、オーサリング、リンク、エンリッチメント、および進化に関する個々のアプローチと最新技術について議論する。最後に、Linked Dataの問題点、限界、さらなる研究開発の課題について議論し、本章を締めくくる。

本章は、2011年にアイルランドのゴールウェイで開催された第7回Reasoning Web Summer Schoolにおける記述論理(DL)の基礎講義に付随するものである。この論理は、今日の最も表現力の高いオントロジー言語であるOWL(Web Ontology Language)ファミリーの形式基盤を構成しているため、近年著しく重要性を増しているこの論理群に関する基本概念と事実を紹介する。

本論文では、まず、記述論理のモデル化能力、および一階述語論理との関係を示すいくつかの一般論と例から始める。次に、DL知識ベースの構文を紹介し、3つの部分からなる形式的な取り扱いを開始する。RBox、TBox、ABoxである。その後、標準的なモデル理論に基づく意味論を提供し、等式を持つ一階論理への埋め込みによって意味論を定義する別の方法を垣間見ることができる。

続いて、DLの命名規則について概観した後、意味的同一性の様々な概念(概念と知識ベースの等価性、およびエミュレーション)に関する考察を行う。これらは、DLの表現力を調査し、正規化を行う上で極めて重要です。次に、様々なDLの特徴とその組み合わせによってもたらされる知識表現能力と、それに関連するいくつかのモデル理論的な特性について検討する。

続いて、DL知識ベースの文脈で発生する典型的な推論タスクについて考察する。これらのタスクのいくつかをどのように互いに削減できるかを示し、DLにおける自動推論を実現するための様々なアルゴリズムアプローチについて考察する。

最後に、DLとOWLの間の接続を確立する。DL知識ベースをOWLで表現する方法と、逆にOWLモデリング機能をDLに変換する方法を紹介します。

我々の考察では、OWL 2 DLと呼ばれるOWLの最も新しく、最も表現力があり、かつ決定可能なバージョンの基礎となっている記述論理SROIQに焦点を当てます。我々は論理的な側面に集中し、データ型や非論理的な特徴をこの論文から省く。この章では、例題と演習が用意されています。

本章は、2011年にアイルランドのゴールウェイで開催された第7回Reasoning Web Summer Schoolでの、含意レジームによるSPARQLに関する講義に付随するものである。SPARQL は資源記述形式(RDF)で指定されたデータに対する問い合わせ言語およびプロトコルである。SPARQLの問い合わせの基本的な評価メカニズムは、部分グラフマッチングに基づくものである。クエリーの条件は、基本グラフパターンと呼ばれる、トリプルの主語、目的語、述語の代わりに変数を持つRDFトリプルの形で与えられます。クエリされたRDFグラフのサブグラフを生成する変数の各インスタンス化は、解を構成する。問い合わせ言語はさらに、オプションの基本グラフパターン、代替グラフパターンなどを問い合わせる機能を持つ。まず、問い合わせ言語としてのSPARQLの主な特徴を紹介する。クエリのセマンティクスを定義するために、クエリを抽象クエリに変換し、SPARQLのクエリ評価メカニズムに従って評価する方法を紹介する。SPARQL 1.0の機能とは別に、World Wide Web ConsortiumのData Access Working Groupが現在開発中のSPARQL 1.1の新機能も簡単に紹介する。

このノートの第2部では、基本的なグラフのパターンマッチングのためのSPARQLの拡張ポイントを紹介します。この拡張ポイントを用いて、RDF Schema (RDFS) entailment や OWL entailment などのより精巧なセマンティクスに基づく基本グラフパターン評価のためのセマンティクスを定義できることを説明する。これは、RDFグラフから暗黙的に導かれるが、必ずしも明示的に存在しないクエリの解決策を可能にするものである。我々は、何が拡張点を構成し、意味的含蓄関係を用いることで発生する問題にどのように対処できるかを説明する。まず、SPARQLとRDFSの結合関係を紹介し、次に、より表現力の高いWeb Ontology Language OWLを紹介する。記述論理に基づくOWLの直接意味論と、RDFS意味論の拡張であるRDFベース意味論を取り上げる。RDFベース意味論では、ルール・エンジンを使った効率的な実装を可能にするOWL 2 RLプロファイルに主に注目する。

読者はRDFとTurtleの基本的な知識を持っていると仮定し、それを例題に使用します。OWLパートでは、OWLまたは記述論理(講義ノート「記述論理の基礎」参照)のいくつかの背景を想定しています。OWLパートの例は、Turtle、OWLの関数型構文、および記述論理の構文で与えられます。例のクエリに関連する推論が説明されていますが、OWLのモデリング構成とその意味論についての基本的な考え方は、確かに役に立ちます。

より多くのデータがRDF形式で提供されるようになり、膨大な量のRDFデータを格納し、そのデータに対するクエリを効率的に処理することがますます重要になってきている。本講演では、RDFの格納方法、効率的なインデックス構造、クエリの最適化技術など、リレーショナルシステムを用いてRDFをスケーラブルに格納・クエリ処理するための最新技術を紹介する。中央集権的なRDFリポジトリはスケーラビリティや障害耐性に限界があるため、分散型アーキテクチャが提案されている。講演の後半では、分散RDF処理のためのシステムアーキテクチャと戦略に焦点を当てます。検索エンジンと連携したクエリプロセッシングを取り上げ、古典的な連携データベースシステムとの違いを明らかにし、一般的な分散クエリ処理、特にRDFデータに対する効率的な技術について議論します。さらに、本講演の最後には、Webからの知識抽出は、これまで見てきた不確実なデータのスケーラブルな管理のための素晴らしいショーケースであり、潜在的に最大の課題の一つであることを論じる。本講演の第三部では、不確実なRDFデータに対する推論(例えば、確率的推論)を数十億のトリプルにまで拡張可能にするための現在のアプローチとプラットフォームについてクローズアップすることを意図している。

本講演の目的は、セマンティックWeb研究者がLinked Dataと大規模オントロジーを利用するための強力なツールとして、スケーラブルな推論・問合せ技術を紹介することと、OWL 2におけるTBoxおよびABox推論を扱う際に生じるセマンティックWebの興味深い研究問題を提示することの2つである。第1部では、Web上でのRDFSとOWLの利用状況を含め、Linked Data上での推論の導入と動機付けを行う。第2部では、OWL 2 RL/RDFルールのカスタムサブセット(OWL 2の扱いやすい断片に基づく)を適用した、インスタンスデータに対するスケーラブルで分散型の推論サービスを紹介する。第三部では、OWL 2 DLの忠実な近似推論に関する最近の研究成果を紹介する。講演では、これらの手法の実装とその評価について紹介する予定です。このノートは、講義の参考資料であり、講義の3部構成と内容に沿ったものである。

この講義では、Web 上でのルールベースの知識表現について紹介する。論理プログラミングと導出ルール言語の論理的基礎を確認し、RuleML、W3C Rule Interchange Format (RIF)、WebルールエンジンProvaなど、既存のWebルール標準言語について説明する。

ウェブオントロジー言語OWLとルールベース形式主義の関係は、多くの議論と研究調査の対象であり、そのうちのいくつかは議論を呼んでいる。この2つのパラダイムを調和させようとする多くの誘惑の中から、我々は最新の開発のいくつかを紹介する。より正確には、現在のバージョンのOWLにおいて、どのような種類のルールを変更することができるかを示し、ルールを組み込むためにOWLをどのように拡張することができるかを示す。最後に、ルールとOWLに関する膨大な仕事への参照を示す。

このノートは、Reasoning Web Summer School 2011でのこのテーマに関する講義の付属資料として作成されたものです。この作品の目的は、データの観点からウェブのモデリングに関する多様で既知の資料を提示し、学生がこのテーマの最初の概要を理解するのに役立つことである。

方法論としては、関連するトピックや文献へのポインタを与え、新しい分野の主要なトレンドと発展を紹介することを目的としています。このノートは、既存の資料を整理することを目的としており、完全であることを保証するものではありません。多くの場合、このノートには推測的な性格があり、主題の統合的な見解を確立するよりも、むしろつながりを示唆し、異なる視点での議論を引き起こすことに重点を置いています。

また、歴史的な記述や参考文献は、いくつかの重要な出来事について、その背景を説明するためにのみ記載されており、知的優先順位を示すものではありません。

信頼と、適切な信頼管理方法論と技術によるそのサポートは、ウェブサービスがより広く受け入れられるための重要な要素の1つになりつつあります。コンピュータ社会では、信頼とそれに関連する問題は前世紀の90年代にはすでに取り上げられていたが、その時期のアプローチはセキュリティ、より正確にはセキュリティサービスやセキュリティメカニズムに関するものであった。ベイズ統計学に基づくアプローチ、デンプスター・シェイファー証拠理論やその後継である主観論理学に基づくアプローチ、ゲーム理論に由来するアプローチなど、より高度なアプローチが行われるようになった。しかし、信頼の根底には認知、評価プロセスがあり、それらは様々な要因によって支配されていることに留意する必要がある。したがって、信頼管理の方法論は、合理的、非合理的、文脈的など、これらの要因を考慮する必要がある。そこで、本研究では、コンピュータサイエンス分野における既存の方法論を概観し、その長所と短所を評価する。さらに、上記の最も重要な要素のいくつかを特定し評価した最新の実験結果も紹介する。最後に、上記の既存の方法論を補完し、最新の実験結果に沿った、Qualitative Assessment Dynamics, QAD (aka Qualitative Algebra) という新しい信頼管理方法論を紹介する。

関係データの複雑な構造を利用することで、オブジェクト間のリンクによって提供される追加情報を考慮し、より良いモデルを構築することができる。我々は、セマンティックウェブデータのデータマイニングを行うための新しいSPARQL-MLアプローチを導入することにより、このアイデアをセマンティックウェブに拡張する。我々のアプローチは、従来のSPARQLと、関係確率木や関係ベイズ分類器などの統計的な関係学習法に基づいている。我々は、合成データセットと実データセットに対して4つの実験を行い、我々のアプローチを徹底的に分析する。その結果、本アプローチはほぼ全てのセマンティックWebデータセットに対して、インスタンスベースの学習と分類を行うことが可能であることがわかった。また、サポートベクターマシンで用いられるカーネル法との比較でも、我々のアプローチが分類精度の面で優れていることが示された。

分散したスキーマとデータレポジトリの統合は、データおよび知識管理アプリケーションにおける主要な課題である。この問題の例としては、データベーススキーマのマッピングから、リンクされたオープンデータクラウドにおけるオブジェクトの照合に至るまで、様々なものがある。我々は、論理的推論と確率的推論を組み合わせた、いくつかの重要なデータ統合問題に対する新しいアプローチを提示する。まず、このフレームワークで使用される記述論理やマルコフ論理のような基本的な形式論の概要を説明する。次に、確率論的論理の枠組みにおける異なる統合問題の表現について説明し、効率的な推論アルゴリズムについて議論する。それぞれのアプリケーションについて、標準的なデータ統合とマッチングのベンチマークを用いた広範な実験を行い、アプローチの効率と性能を評価した。評価結果は非常に有望であり、このフレームワークの柔軟性により、他の実世界のデータ統合問題にも容易に適応することができる。

コンピュータは、個人や企業の意思決定を支援する上で、ますます重要な役割を果たすようになっています。例えば、個人がどの製品を購入するかの意思決定や、産業界がどのように製品を製造するのが最適かについての意思決定を支援することができる。制約プログラミングは、意思決定を強力に支援します。制約プログラミングは、膨大な選択肢の中から素早く検索し、その選択肢の持つ意味を理解することができます。このチュートリアルでは、組合せ問題のモデルを開発し、制約プログラミング、充足可能性、混合整数計画法を使って問題を解く方法を学びます。このチュートリアルでは、Cork Constraint Computation Centreで開発されたオープンソースのPythonベースの最適化システムであるNumberjackを使用する予定です。チュートリアルの焦点は、様々なネットワーク設計問題とWebにおける最適化の課題です。

次回はReasoning Web2012について述べる。

コメント

  1. […] 次回はReasoning Web 2011について述べる。 […]

タイトルとURLをコピーしました