Reasoning Web 2012論文集より

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術   AI学会論文    知識情報処理技術   AI学会論文を集めて     推論技術

前回はReasoning Web2011について述べた。今回は、2012年9月3日から8日にかけてオーストリアのウィーンで開催された第8回Reasoning Web Summer School 2012について述べる。

Reasoning Web Summer Schoolシリーズは、Webにおける推論技術の活発な分野における主要な教育イベントとなっており、若手から熟練した研究者までが参加している。マルタ(2005年)、リスボン(2006年)、ドレスデン(2007年、2010年)、ベニス(2008年)、ブレッサノン-ブリクセン(2009年)、ゴールウェイ(2011年)で開催し、講義の内容や質で高い基準を設けることに成功しており、2012年はオーストリア・ウィーン工科大学知識ベースシステムグループが主催した。今回のサマースクールは、前回同様、International Conference on Web Reasoning and Rule Systems (RR)と併催され、また、非公式の学生ポスターセッションが開催された。

2012年のサマースクールでは、「Webにおける高度なクエリ応答」という一般的なモチーフのもと、プログラムが組まれた。また、セマンティックWebに関連した、クエリ応答が重要な役割を果たすアプリケーション分野や、その性質上、クエリ応答に新たな課題や問題をもたらす分野にも焦点を当てている。

チュートリアル論文は、サマースクールの受講生が理解を深め、さらに詳細な論文を読むための参考資料として、講師陣が作成した質の高いものとなる。また、主催者がサマースクール参加者にふさわしいと判断した、コンピュータとその応用に関する十分な背景を、科学界やより広く関心のある読者に提供するものとなる。10本の論文は、次のように3つのパートに分類される。

第一部は、異なるデータおよび知識表現形式における問合せ応答に関する基礎的なトピックを扱った3つの章からなる。

– 記述ロジックの推論と問合せ応答(第1章)
– セマンティックウェブデータベースのためのデータログとその拡張(第2章)
– SPARQL 1.1におけるフェデレーションとナビゲーション(第3章)。

第2部は、オントロジー言語とオントロジーの高度な推論タスクに関する3つの章から構成されています。

– OWL2Profiles:軽量オントロジー言語への入門(第4章)
– データ抽出における推論とオントロジー(第5章)
– セマンティックウェブにおける不確かで一貫性のないオントロジーの推論(第6章)

最後の第3部では、セマンティックWeb上の困難なアプリケーションのための高度な問合せと推論タスクについて、4つの章に分けて紹介する。

– リンクデータ・ストリーム処理 (第7章)
– リンクされた地理空間データのためのデータモデルとクエリ言語(第8章)
– セマンティックウィキ。アプローチ、アプリケーション、および展望(第9章)
– 論証とWeb(第10章)

すべてのチュートリアルの付属の講義スライドと教材は、サマースクールのウェブサイト(http://reasoningweb.org/2012/)で公開されている。

以下に詳細の内容について述べる。

記述論理(DL)は、オントロジーを表現し、推論するためのフォーマリズムとして中心的な役割を担っている。本講演では、DLの基本を紹介する。また、表現力豊かなDLを含む最も著名なDLの知識モデリング能力について説明し、DLによる推論サービスをいくつか紹介します。特に、問合せ応答問題や、DLオントロジーを介してデータリポジトリに問合せを行うという、ますます一般的になっているフレームワークに注目する。この設定で生じる主な課題の概要を説明し、軽量DLと表現力豊かなDLの両方に対する問い合わせ応答技術を調査し、計算複雑さの概要を説明する。

70年代初頭から、データ管理は組織において中心的な役割を果たし、困難な研究分野とされてきた。データのモデル化、問い合わせ、操作のための言語や、整合性制約、推論手続き、オントロジー知識などの非常に一般的なクラスを表現するための言語が多数提案されている。このような言語は、セマンティックデータの公開と統合、意思決定支援、知識管理などの多くのアプリケーションにとって、今や不可欠なものとなっている。このチュートリアルでは、まず、元々は関係データに対する複雑な問い合わせを表現するための強力なルールベース言語であり、今日では、データおよび知識ベースにおける最適化および制約充足問題の仕様やオントロジー制約のための言語の基礎となっているDatalogについて紹介します。次に、セマンティックウェブ、特にオントロジーモデリングと推論に対するデータログの限界について議論し、セマンティックウェブのセマンティックデータモデリングの標準言語であるOWLファミリーのオントロジー言語のいくつかを捉えることができる拡張機能を紹介する。

SPARQLは現在、RDFの標準的な問い合わせ言語として広く使われています。2008年に最初のバージョンがリリースされて以来、この標準を担当するW3Cグループは、新バージョンであるSPARQL 1.1に含まれる言語の拡張に取り組んできました。これらの拡張機能には、RDFのクエリに役立ついくつかの興味深い、非常に便利な機能が含まれています。

この論文では、SPARQL 1.1の2つの重要な機能について調査します。フェデレーションとナビゲーション機能です。まず、SPARQL標準を紹介し、その構文と形式的なセマンティクスを提示する。次に、SPARQL 1.1におけるフェデレーションとナビゲーションの形式化に注目する。表現力や複雑さといった古典的な理論問題を分析し、アルゴリズム的な特性について議論する。さらに、SPARQL 1.1におけるフェデレーションとナビゲーションの規範的セマンティクスに関して、最近発見されたいくつかの重要な問題、特に、いくつかの無限のフェデレーションクエリに答えることの不可能性と、ナビゲーション機能を含むクエリの評価問題の高い計算複雑性について紹介する。最後に、これらの問題を克服するための可能な代替案と、標準の採用に対するその影響について議論する。

この章では、ウェブ・オントロジー言語 OWL の軽量プロファイル OWL EL、OWL QL、および OWL RL を拡張紹介する。この3つのオントロジー言語規格は、オントロジー推論を大幅に簡略化する方法で制限されたOWL DLのサブ言語である。OWL DL全体と比較して、OWLプロファイルの推論アルゴリズムは高い性能を示し、実装が容易で、より大きなデータ量に拡張することができる。オントロジー推論はOWLオントロジーの設計と展開に非常に重要であるため、プロファイルは多くのアプリケーションにとって非常に魅力的である。OWLのさまざまなモデリング機能は,OWLプロファイルのすべてまたは一部で利用可能ではない。さらに,プロファイルは,それぞれが他のどれでも利用できない機能の組み合わせを提供するという意味で,相互に比較不可能である。この章では、これらの違いの概要を説明し、そのうちのいくつかが望ましい特性を保持するために不可欠である理由を説明する。この目的のために、OWLと記述論理(DL)の関係を思い出し、推論アルゴリズムにおいて各プロファイルが典型的にどのように扱われるかを示す。

ウェブは豚小屋と化し、誰もが無作為の場所に、無作為の形で情報を投棄する。家賃、交通費、税金、暖房費を考慮したオックスフォードの最も安いアパートや、SSDドライブを搭載した安くてリーズナブルな11インチのラップトップを探してみてください。

データ抽出は、構造化された情報をこのスタイルから洗い出す。データ抽出は、ほとんど構造化されていないウェブページを高度に構造化された知識に変える。この章では、データ抽出について、既存のシステムへのポインタを含め、やさしく紹介する。まず、データ抽出システムの概要と分類を、監視のレベルと考慮される規模という2つの主要な次元に沿って説明します。本章の残りの部分は、これらのアプローチをサイト固有、教師あり、ドメイン固有、教師なしに大別して構成されています。まず、教師ありデータ抽出について説明する。ここでは、ユーザがサイトごとに関連データの例を特定し、システムがこれらの例を抽出プログラムに一般化する。特に、宣言型とルールベースのパラダイムに注目する。第二部では、システムが自ら関連データを特定し、多くのウェブサイトから完全に自動でデータを抽出する、完全自動化(または教師なし)アプローチに注目する。オントロジーやスキーマは、教師なしデータ抽出のガイドとして非常に有用であることが証明されており、既存のアプローチの概要と、オントロジーを使用するさまざまな方法について紹介する。

記述論理に基づくオントロジー工学の発展において、記述論理における不確実性の推論と矛盾の推論は重要な課題である。オントロジーを構築する際、矛盾したオントロジーや、信頼度などの不確かな情報が蔓延したオントロジーを得ることがある。本論文では、記述論理において、無矛盾かつ不確実なオントロジーを推論するためのいくつかのアプローチを提案する。本論文は2つの部分から構成される。第1部では、不確実な情報を持つオントロジーのための矛盾に強いセマンティクスを提案する。第二部では、誤ったマッピングによって引き起こされる2つの異種オントロジー間の不整合を解決するためのアプローチを提案する。

Linked Stream Dataは、Linked Dataの原則に従って、動的で時間依存性のあるデータストリームを表現する取り組みとして登場しました。センサーやソーシャルネットワークサービスのような利用可能なストリームデータソースが増加していることを考えると、Linked Stream Dataは、異種ストリームデータ間だけでなく、ストリームとLinked Dataコレクション間の簡単でシームレスな統合を可能にし、新しいリアルタイムアプリケーションの範囲を可能にするものである。

このチュートリアルでは、Linked Stream Dataの処理について概要を説明します。処理の基本的な要件について説明し、時間的な側面やメモリのオーバーフローを管理するような、直面する課題に焦点を当てます。Linked Stream Data処理エンジンの様々なアーキテクチャ、それらの利点と欠点について説明します。また、最新のLinked Stream Data処理システムをレビューし、設計の選択と全体的な性能に関するシステム間の比較を提供します。最後に、現在の課題である未解決問題についての簡単な議論を行います。

近年、地理空間情報がリンクされたオープンデータとして利用できるようになったことで、データベースや人工知能の分野で長い研究の伝統を持つ地理空間問合せ処理と推論に新たな関心が生じている。本論文では、この重要な研究テーマにおける最近の進歩について、データモデリングとクエリの問題に焦点を当てながら調査する。

セマンティックウィキが最初に提案されてから10年(2001-2011)、様々な目的のためにシステムが考案され、開発され、利用されてきた。この記事では、セマンティックウィキに関する研究の包括的な最新情報を提供することを目的とし、幅広く、おそらく経験の浅い人々にも使いやすい点を強調する。さらに、セマンティックウィキの研究を推進したアプリケーションとユースケース、ソフトウェア技術、セマンティックウィキのために提案されたアーキテクチャについて説明する。最後に、さらなる研究の可能性を示唆する。

このチュートリアルでは、計算論証の概要を、抽象的論証と仮定に基づく論証に焦点を当て、それらがどのように関連するか、また、Webコンテキスト、特にセマンティックWebとソーシャルネットワークにおける後者の使用可能性に焦点を当てて説明する。このチュートリアルでは、これまでの成果と(いくつかの)未解決問題の概要を説明します。

次回はReasoning Web 2013について述べる。

コメント

  1. […] 次回はReasoning Web2012について述べる。 […]

タイトルとURLをコピーしました