Reasoning Web 2014論文集より

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術   AI学会論文    知識情報処理技術   AI学会論文を集めて     推論技術

前回は、Reasoning Web 2013について述べた。今回は、2014年9月8日から13日にかけてギリシャのアテネで開催された第10回Reasoning Web Sum- mer School (RW 2014)について述べる。

Reasoning Webシリーズは、European Network of Excellence REWERSEによって2005年に開始された年次サマースクールとなる。2005年以来、この学校はWeb上の推論技術の分野における主要な教育イベントとなっており、若手と熟練した研究者の両方を牽引している。2014年版のスクールは、アテネ国立カポディストリア大学情報学・電気通信学部(Manolis Koubarakis教授)とアテネ国立工科大学通信・コンピュータシステム研究所(Giorgos Stamou教授とGiorgos Stoilos博士)によって開催された。今年のサマースクールは、前回と同様、8th International Conference on Web Reasoning and Rule Systems (RR 2014)と併催された。

セマンティックWebやLinked Dataの研究領域は、セマンティックWebやLinked Dataの利用シーンで求められる高度な機能の多くが推論を必要とするため、近年のReasoning Web Summer Schoolでは包括的にカバーされています。2014年、このスクールのテーマは”ビッグデータ時代のWeb上の推論 “となる。

センサー、ソーシャルネットワークプラットフォーム、スマートフォンなどの新しい技術の発明により、組織は従来利用できなかった膨大な量のデータを利用し、社内の独自データと組み合わせることができるようになった。同時に、テラバイト、ペタバイト級のデータを扱うデータマネジメントや知識発見技術の実現を可能にする基盤技術(弾力的なクラウドコンピューティング基盤など)も大きく進展している。2014年度の推論Webスクールの講義プログラムは、このような産業界の現実を反映し、セマンティックWebやLinked Dataなどのビッグデータの側面における最近の進歩や、ビッグデータ応用に取り組むための推論技術の基礎を紹介している。

すべてのチュートリアルの講義スライドは、サマースクールのWebサイト(http://rw2014.di.uoa.gr/)でみることができる。

以下に詳細を述べる。

Linked Open Data

Linked Dataは、セマンティックWebのビジョンを達成するための非常に実用的なアプローチで、ここ数年、人気を博している。Linked Dataという用語は、ウェブ上で構造化されたデータを公開し、相互にリンクするためのベストプラクティスの集合を指す。セマンティックウェブコミュニティで開発された多くの標準、手法、技術はLinked Dataに適用可能であるが、考慮しなければならないLinked Data特有の特性も数多く存在する。この記事では、Linked Dataの主要なコンセプトを紹介する。また、Linked Dataのライフサイクルの概要を示し、Linked Dataの抽出、オーサリング、リンク、エンリッチメント、および品質に関する個々のアプローチと最新技術について議論する。最後に、Linked Dataの問題点、限界、更なる研究開発の課題について議論することで、この章を締めくくる。本稿は、Reasoning Web Summer School 2013で行った同様の講義をアップデートしたものです。

リンクデータとして利用可能な知識の量が増える一方で、エンドユーザがこれらの知識にアクセスできるようにする必要性も高まっています。特に質問応答システムは、自然言語によるデータへの直感的なアクセスを提供し、データモデリング、ボキャブラリー、クエリ言語に関する技術的な側面からエンドユーザを保護するため、大きな関心を集めています。このチュートリアルでは、急速に発展しているリンクデータ上の質問応答について紹介します。このチュートリアルでは、自然言語で表現されたユーザーの情報ニーズを、クエリされるデータに関して解釈する際の主な課題の概要を説明します。この論文では、利用可能なツールやリソース、ベンチマーク、評価キャンペーンなど、既存の主なアプローチやシステムを要約している。最後に、リンクデータ上の質問応答が今後数年間エキサイティングな研究領域であり続けるためのオープントピックをリストアップしている。

RDF and Graph Databases

RDFは近年、学術・産業界の様々なアプリケーションやユースケースで使用される非常に一般的なデータモデルとなっています。クエリ処理と評価は、一般的なデータ管理における中心的な要素であり、したがって、当然のことながら、RDFデータ管理の分野で最も活発な研究分野の1つである。この章では、異なるシステムアーキテクチャを用いたRDFデータモデルの問い合わせ処理技術の概要を説明する。ピアツーピア、フェデレート、クラウドベースなど、集中型および分散型RDFストアの技術について調査しています。

分析環境におけるグラフの利用はますます広がっており、ソーシャルネットワーク分析、不正検出、産業管理、知識分析など、様々な環境での応用が期待されています。グラフデータベースは、大規模データセットの管理において考慮すべき重要なソリューションの1つである。このコースでは、グラフ管理の4つの重要な側面に取り組むことを指向している。まず、グラフの特徴、およびグラフに適用される最も一般的な操作について説明する。2つ目は、グラフ管理のための技術をレビューし、Sparkseeの特別なケースに焦点を当てる。3つ目は、いくつかの重要なアプリケーションと、それを解決するためにグラフがどのように使用されるかを詳細に分析することです。第四に、ユーザーの要求とグラフ管理技術の成長を両立させるためのベンチマークの利用を理解する。

Description Logic Based Ontologies

この章では、OWL2 Web Ontology Languageとその3つの扱いやすいプロファイルであるOWL 2 RL、OWL 2 ELおよびOWL 2 QLの基礎となる記述論理の概要を説明する。我々は、これらの記述論理の構文と意味論、および、主な推論タスクとその計算複雑性を考察する。また、OWL 2プロファイルで与えられる知識ベースに対する接続クエリの一次およびデータログ書き換えの意味論的基礎について議論し、オントロジーに基づくデータアクセスシステム「Ontop」のアーキテクチャを概説する。

データベース、知識表現、セマンティックウェブなどの分野では、データの上にオントロジー層を設け、オントロジー知識を活用できる高度な推論機構が必要であることが認識されている。ここでは、オントロジー知識を考慮しながらデータを問い合わせるという、オントロジーに基づくデータ問い合わせ問題に焦点を当てる。この問題に取り組むために、我々はデータログ±とも呼ばれる実存的規則に基づく論理的枠組みを検討する。

本講座では、存在規則を用いたオントロジーに基づく問合せ応答に関する基本的な概念を紹介する。また、基本的な推論技術を紹介し、軽量記述論理のような他の形式主義との関係を説明し、決定可能性の結果や関連するアルゴリズムについてレビューする。最後に、現在進行中の研究およびいくつかの挑戦的な問題について述べる。

時間に依存するデータの処理は古くから研究されてきたが、最近ではリンクされたオープンデータやオントロジーを対象とした時間推論、特にストリーム推論の研究が盛んになってきている。このチュートリアルでは、時間的推論とストリーム推論のための最新のクエリ言語とエンジンの概要を説明する。より詳細なレベルでは、新しい言語STARQL (Reasoning-based Query Language for Streaming and Temporal ontology Access)について説明します。STARQLは、表現力豊かで柔軟なストリームクエリフレームワークとして設計されており、オントロジー上のフィルタクエリ言語として異なる(時間)記述論理を埋め込む可能性を提供するため、OBDAパラダイム(古典的意味でのOntology Based Data Access)やABDEOパラダイム(Accessing Big Data over Expressive Ontologies)で利用することが可能である。

Applications

確率データベース(PDB)は、データベース、一階論理、確率論の表現上の中間領域に位置する。PDBは論理的な推論ルールを用いてSPJ(Select-Project-Join)問合せを処理し、データログ、関係代数、SQLなどの様々な宣言型問合せ言語の基礎となる。また、データの不整合を解決するために論理的整合性制約を用い、クエリの答えを論理的な系統式(別名「データの出自」)で表現し、その答えを導いた入力タプルとの間の依存関係を追跡することができる。PDBに関する文献は25年以上前にさかのぼるが、この種の確率的データに対する関係演算の閉じた完全な表現モデルを確立するための系譜の重要な役割が発見されたのはごく最近である。PDBはデータの保存と索引付けのための効率的でスケーラブルなデータベース基盤の恩恵を受けているが、データ計算と確率的推論が組み合わされており、後者はPDBの文脈においても#P困難な問題であり続けている。

本章では、PDBの主要な概念について概説し、特にこの分野に関する我々の最近の研究成果に焦点を当てる。また、PDBに関連する現在進行中の研究課題を取り上げ、情報抽出(IE)シナリオを、IE技術から得られた不確実で時間的な事実をPDB内で直接管理する実行アプリケーションとして言及し続ける。

セマンティックウェブはついに研究室を飛び出しつつある。この記事では、実用的で産業向けのセマンティックウェブシステムをいくつか検証し、この破壊的な技術に関するコストと利益について議論する。都市と市民のためのアプリケーションに焦点を当て、一連の主要な課題と、セマンティックを利用して可能になった解決策を提示する。また、セマンティック技術の差別化要因、ユニークな機能、そしてこのパラダイムシフトにかかるコストについても紹介します。

次回はReasoning Web2015について述べる。

コメント

  1. […] 次回はReasoning Web 2014について述べる。 […]

タイトルとURLをコピーしました