Reasoning Web 2009論文集より

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術   AI学会論文    知識情報処理技術   AI学会論文を集めて     推論技術

セマンティックウェブは、応用計算機科学における現在の主要な試みの一つである。セマンティックウェブの目的は、既存のウェブをメタデータと処理方法で強化し、ウェブベースのシステムに高度な(いわゆる知的)機能、特にコンテキスト認識と意思決定サポートを提供することである。

セマンティックウェブアプリケーションのシナリオで必要とされる高度な能力は、主に推論を必要とする。推論機能は、現在開発中のセマンティックWeb言語によって提供される。しかし、これらの言語の多くは、機能中心(例:オントロジー推論、アクセス検証)またはアプリケーション中心(例:Webサービス検索、合成)の観点から開発されている。セマンティックウェブシステムとアプリケーションには、上記の活動を補本サマースクールでは、このような視点に立ちます。「推論ウェブ」シリーズは、Network of Excellence REWERSEのワークパッケージ「教育と訓練(ET)」を代表して、2005年に開始された年次サマースクールとなる。

前回は、セマンティックウェブ技術が問題解決に特に有効である、あるいは有望であることが証明された、いくつかの重要な応用領域に焦点を当てた。今回は、Web上のデータアクセスを強化するためのセマンティック技術の活用に焦点を当てた。このため、コースでは、セマンティックベースとデータ集約型システムの橋渡しをする様々な技術や形式主義が紹介された。

この学校では、データ管理の強い観点からセマンティックウェブの基礎を紹介し、データクエリのためのスケーラブルなセマンティックベースの技術のアプリケーションを紹介した。講義では、記述論理の推論手順の設計と分析、アンサーセットプログラミングの基礎、そのモデリング手法とセマンティックWebアプリケーションに合わせた主要な拡張、XMLデータの制約と問い合わせのための言語、RDFデータベースの理論とRDF/OWLデータの格納、読み込み、推論、問い合わせのための効率的で拡張性の高いサポート、扱いやすい記述論理とオントロジーに基づくデータアクセスへの利用、ユーザーの個人情報環境からセマンティックWebのソースとエンドポイントとして定義されるソーシャルセマンティックデスクトップの話題を扱った。

記述論理(DL)は、論理ベースの知識表現形式としてよく研究されているもので、アプリケーションドメインの概念的知識を構造的かつ形式的によく理解された方法で表現するために使用することができる。自然言語処理、設定、データベースなど様々な応用分野で採用されているが、これまでの最も注目すべき成果は、DLベースの言語OWLがセマンティックWebの標準オントロジー言語として採用されたことである。

本稿では、DLのための推論手続き設計の問題に焦点を当てる。過去20年間のこの分野の研究の簡単な紹介と概要の後、一方では、Webオントロジー言語OWL DLでの推論の基礎である表現力豊かなDLでの推論のためのアプローチを提示する。一方、バイオメディカルオントロジーで採用され、OWL 2プロファイルOWL 2 ELの基礎となっている、より軽量なDL ELにおける扱いやすい推論を検討する。

答集合プログラミング(ASP)は、論理プログラミングと非単調推論に根ざした宣言的問題解決パラダイムであり、ここ数年、ますます注目されている。本論文は、その入門編である。動機付けから始まり、否定を含む論理プログラムの意味論を定義するという挑戦の歴史的な展開を追う。層化されたプログラムに対する正プログラムから、任意のプログラムへの拡張、そして2種類の否定(弱い否定と強い否定と名付けられる)、ルールヘッドにおけるディスジャンクションに至るまでが検討されている。第2部では、ASPパラダイムそのものを取り上げ、その基本的な考え方を説明する。そして、いくつかのプログラミング技術を紹介し、アンサーセットソルバの概要を簡単に説明する。第3部では、セマンティックWebの文脈におけるASPについて、いくつかの形式論を提示し、この分野でのいくつかのアプリケーションについて言及する。最後に、現在および将来のASP研究の課題について述べています。

XMLは多くのウェブデータの基礎となる表現形式である。したがって、ウェブデータを推論するには、基本的にXML形式のデータを推論することに集約される。このコースでは、XMLデータを問い合わせるための主な言語について学びます。XPathとXQueryです。このコースでは、理論的な学習と実践的な例題の両方が含まれています。

本論文の目的は、RDFデータベースの理論の基本を概観することである。このモデルを他のグラフ・データ・モデルと区別する特徴を含む、RDFの正式な定義を提供する。次に、RDFデータの問い合わせの基本的な問題に移る。まず、2008年1月にW3C勧告となったRDF問合せ言語SPARQLを検討する。この言語の代数的構文と構成的セマンティクスを提供し、SPARQLの異なるフラグメントに対する評価問題の複雑さを研究し、SPARQLクエリの評価を最適化する問題を検討し、この言語の自然なフラグメントがこの点でいくつかの良い特性を持つことを示す。さらに、関係代数のようなよく知られた問合せ言語と比較することにより、SPARQLの表現力を研究する。最後に、RDFSの語彙が存在する場合のRDFデータに対する問い合わせの問題を検討する。特に、最近提案されたナビゲーション機能を持つSPARQLの拡張を紹介する。

RDF/OWLデータの保存、ロード、推論、クエリに対する効率的でスケーラブルなサポートと、エンタープライズレベルのデータおよび運用の信頼性要件に対する既に利用可能なサポートを組み合わせることにより、データベースはエンタープライズレベルのRDF/OWLリポジトリとして機能するようになり、エンタープライズ環境向けのセマンティックアプリケーション構築用のプラットフォームとして実現することができます。

このチュートリアルでは、データベースでセマンティック技術をサポートするための要件として、バルクロードやデータ操作、RDFSやOWL、ユーザー定義のルールに基づく推論、SPARQLクエリのサポートについて概説します。また、大規模なRDF/OWLデータの保存と操作のサポートを実装する際に発生する問題に対処するための設計上の選択についても説明し、一般に、エンタープライズ環境で重要になるRDF/OWLサポートに関する実践的側面についても触れます。Oracle Databaseにおけるセマンティック技術のサポートをケーススタディとして、主要な要件と設計上の問題点を具体的な例で説明しています。

ソーシャルセマンティックデスクトップのビジョンは、ユーザーの個人的な情報環境をセマンティックウェブのソースとエンドポイントとして定義しています。ナレッジワーカーは、自分の情報やデータを自分自身の概念に基づいて包括的に表現します。セマンティックウェブ言語とプロトコルは、これらの概念化を形式化し、ローカルおよびグローバルな情報アクセスを調整するために使用されます。

重要な課題は、既存のレガシーデスクトップデータをソーシャルセマンティックデスクトップに統合することです。セマンティックリフティングとは、様々なタイプの(半)構造化データや非セマンティックメタデータのセマンティクスを取得し、そのデータをセマンティックウェブの概念に変換するプロセスである。

NEPOMUKプロジェクトで追求されているソーシャルセマンティックデスクトップのビジョンから、知識表現に関するいくつかの要件と研究課題を特定しました。このようなシナリオに必要な表現力という一般的な問題に加えて、次の2つの主要な課題が浮かび上がった。 i) 知識モデルとオントロジーの異質性、特に潜在的に異なる解釈を持つ複数の知識モジュールにどう対処するか ii) 様々なアプリケーションを活用する際の異なるニーズに対するオントロジーテーラリングをどうサポートするか

本論文では、セマンティックメタデータを作成する手段としてのセマンティックリフティングと、これらのメタデータを表現する手段としてのNepomuk Representation Language (NRL) を紹介する。NRLは、前述の2つの疑問に対するアプローチであり、モジュール化の側面では名前付きグラフに、オントロジーのテーラーリングの側面ではビューコンセプトに基づくものである。このビューコンセプトは、同じ構文構造に対して異なるセマンティクスを付与するメカニズムも提供するため、さらなる価値を持つことが判明した。

さらに、Social Semantic Desktopのセマンティックな基盤を構築するために、NEPOMUKプロジェクトでNRLの協力を得て開発されたオントロジーをいくつか紹介する。

オントロジーは、ある関心領域の概念化を提供するものである。現在では、一般的に記述論理(DL)で表現され、様々な現場で情報の意味付けを記述するためのキーテクノロジーと見なされている。データリポジトリに対する概念的な見方としてオントロジーを利用するという考え方は一般的になりつつあるが、標準的なアプリケーションで普及するためには、基盤となるデータ層にアクセスする概念層が、データを扱う上で大きなオーバーヘッドをもたらさないことが基本である。このような観点から、近年、DL-Liteと呼ばれるDLファミリーが提案されている。これは、基本的なオントロジーや概念データモデリング言語を取り込みつつ、推論や複雑な問いに答える際の複雑さを低く抑えるもので、特にデータの大きさを基準とした場合に適している。この記事では、DL-Liteファミリーで達成された主な成果をまとめて紹介します。特に、DL-LiteA,idに焦点を当て、DL-LiteA,idオントロジーの推論と問合せ応答に関するアルゴリズムを提示し、その計算複雑性を分析する。このようなアルゴリズムは、DL-Liteファミリーの論理の特徴である、オントロジー推論と接続クエリの回答が一次書き換え可能、すなわち、リレーショナルデータベース管理システムに委ねることができることを利用するものである。また、典型的なDL構成要素による論理の拡張の効果を分析し、そのような拡張のほとんどで、DL-Liteファミリーの優れた計算機的特性が失われることを示す。次に、オントロジーを介してリレーショナルデータソースにアクセスする問題を取り上げ、オントロジー内の抽象オブジェクトとデータソースに現れる値との間のインピーダンス不整合という悪名高い問題に対する解決策を提示する。この解決策では、データソースから抽出された適切な値からオントロジー内のオブジェクトを作成する適切なマッピングを利用する。最後に、上記の解決策をすべて実装し、DIG-QUONTOサーバーによってラップされたQUONTOシステムについて説明します。これにより、外部データソースにアクセスするための拡張機能を備えたDL-LiteA,idの標準DL推論システムが提供されます。

次回はReasoning Web2010について述べる。

コメント

  1. […] 次回は、Reasoning Web 2009として、Web上のデータアクセスを強化するためのセマンティック技術の活用に焦点を当てたものについて述べる。 […]

タイトルとURLをコピーしました