Reasoning Web 2006論文集について

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術   AI学会論文    知識情報処理技術   AI学会論文を集めて     推論技術

前回は、Reasoning Web2005について述べた。今回は、2006年9月4日から6日にかけてリスボンで開催されたリスボン新大学(Universidade Nova de Lisboa)主催のサマースクール「Reasoning Web 2006」(http://reasoningweb.org)について述べる。

2005年に開催された第1回「Reasoning Web」サマースクール(cf. LNCS 3564)と同様、今回のサマースクール「Reasoning Web 2006」は、Network of Excellence REWERSE, “Reasoning on the Web with Rules and Semantics” (http://rewerse.net) が主催し、そのメンバーであるリスボン新大学の人工知能センター (CENTRIA) が現地運営に携わりました。

推論はセマンティックウェブの研究開発において中心的な課題の一つである。実際、セマンティックウェブは、セマンティクスを運ぶ「メタデータ」と推論手法によって、今日のウェブを強化することを目的としている。セマンティックウェブは、学術界と産業界の両方が関与する非常に活発な研究開発分野である。

推論ウェブ」サマースクールは、「セマンティック・ウェブ」分野の最新動向を発表し、議論するための年1回のフォーラムを提供します。特に、応用推論とその応用に重点を置いています。セマンティックウェブ分野の研究・開発に携わる若手研究者、特に博士課程学生、若手専門家を対象としています(ただし、それだけではありません)。

サマースクール「推論Web2006」のプログラムでは、以下のような問題を扱います。

– セマンティックウェブ問合せ言語
– セマンティックウェブのルールとオントロジー
– バイオインフォマティクスと医療オントロジー – 産業的側面

セマンティックウェブのクエリ言語。WebやセマンティックWebでは、データベースと同様に問い合わせ言語が重要な役割を果たすと考えられています。実際、今日のWeb上の多くの実用的なアプリケーションや、今後登場が期待されるセマンティックWebのアプリケーションの多くは、インフォーメーションシステムとして捉えることができる。問い合わせ言語は、複雑なデータベースや情報システムからのデータ検索を容易にする。WebやセマンティックWebのための問い合わせ言語は活発な研究分野であり、2006年4月には資源記述フレームワークRDFのための問い合わせ言語SPARQLが「W3C勧告候補」(cf. http://www.w3. org/TR/rdf-sparql-query/ )になった。2004年から、RDFに対する多くの問い合わせ方法が提案されている。今回のサマースクール「Reasoning Web 2006」では、SPARQLを開発した「W3C RDF Data Access Working Group」のBijan ParsiaによるSPARQLの紹介と、Tim Furche, Benedikt Linse, Dimitris Plexousakis, Georg Gottlob, そして私によるRDF用問い合わせ言語の比較解説をプログラムに取り入れ、このことに賛辞を贈りました。この概要は、サマースクール “ReasoningWeb 2005 “で発表した最初の比較をさらに深化させたもので、RDFのために提案されたほとんどすべての問い合わせ言語について、より表面的な方法で検討したものである。

セマンティックウェブのルールとオントロジー ルールベースのフォーマリズムは現在、セマンティックウェブの研究者や開発者から大きな注目を集めている。例えば、W3Cは2005年11月に “Rule Interchange Format (RIF)” Working Groupを立ち上げ(cf. http://www.w3.org/2005/rules/)、多くの研究者がXML、RDF、OWLデータでルールベースの推論がどのように適用できるかを研究中である。そこで、今回のサマースクール「Reasoning Web 2006」では、このテーマについて4つの補足的な講義を行ないました。そのうち2つはRic-cardo Rosati氏、Thomas Eiter氏、Giovambattista Ianni氏、Axel Polleres氏、Roman Schindlauer氏、Hans Tompits氏が、それぞれオントロジーを用いたルールベース推論の最近のアプローチについて講演を行った。さらに、Silvie Spreeuwenberg氏とRik Gerrits氏による講演では、「ビジネスルール」と「セマンティックWebルール」の共通点と相違点が議論された。4番目と最後の講演では、Uwe Aßmann、Jendrik Johannes、Jakob Henriksson、Ilie SavgaによるセマンティックWebのためのルールベースのフォーマリズムについて、最新のソフトウェア構成手法がセマンティックWebルール言語にいかに適用できるかが示された。

バイオインフォマティクスとメディカルオントロジー。バイオインフォマティクスと医学は、セマンティックウェブの手法がより多く適用される分野である。このため、セマンティックウェブの研究者や開発者は、これらの分野でのセマンティックウェブの応用から多くを学ぶことができる。そこで、今回のサマースクール「Reasoning Web 2006」では、バイオインフォマティクスとメディカルオントロジーに関する3つの講義を実施した。アラン・レクター氏とジェレミー・ロジャース氏による最初の講義では、GALENオントロジーにおける医療概念の表現が紹介され、マイケル・シュローダー氏とパトリック・ラムリックス氏による2番目の講義では、「生命科学のためのセマンティックWeb」の基礎が説明された。

産業界への影響 最後に、サマースクール「Reasoning Web 2006」では、Alain L ́eger、Johannes Heinecke、Lyndon J.B. Nixon、Pavel Shvaiko、Jean Charlet、Paola Hobson および François Goasdou ́eが、セマンティックWebの産業的側面について講演を行った。

今回のサマースクール「Reasoning Web 2006」は、多くの方々のご協力により実現することができました。また、プログラム委員会には、リスボン新大学のPedro Barahona氏、Bozen-Bolzano自由大学のEnrico Franconi氏、Hannover大学のNicola Henze氏、Manchester大学のUlrike Sattler氏が参加し、講義の選定や質の評価において、多大なご協力を頂きました。ウルリケ・サトラー氏は、講義ノートをまとめ、この本を作成したことで特筆に価する。また、「推論ウェブ」サマースクールを運営しているREWERSEワーキンググループ「教育と訓練」のコーディネーターと副コーディネーターのリンコ・キングス大学のヤン・マルスィン、ミュンヘン大学のノルベルト・アイジンガーにも言及したいと思います。

そして、サマースクール開催までの8ヶ月間、何度も何度も試行錯誤を繰り返した忍耐力にも、心から感謝しています。

セマンティックウェブ問合せ言語

本稿は、第一にセマンティックWebのための問い合わせ言語について紹介し、第二に紹介した言語を詳細に比較するものである。この論文を書いている時点では、他のセマンティックWebデータモデリングの形式、特にOWLのためのクエリ言語はまだ未解決の研究課題であり、RDF以外の形式でモデリングされたセマンティックWebデータのクエリのための提案はごく少数しか存在せず、さらに不完全なためRDFクエリ言語のみを検討しています。RDF問合せ言語を数種類に限定したのは、対象言語の詳細な比較という目的と、スペースの制限の両方が動機となっています。この記事を書くまでの3年間に、RDF問い合わせ言語に関する提案が30件以上発表されています。このように数が多いだけでなく、提案の性質が未熟であることが多いため、少数の、しかし代表的な言語に焦点を当てることが、自明ではない比較のための必要条件となっています。

本稿では、主観的ではあるが、以下のRDF問合せ言語を選択した。第一に、「関係」あるいは「パターンベース」の問い合わせ言語SPARQL、RQL、TRIPLE、Xcerpt、第二に、反応規則問い合わせ言語Algae、第三に、最後に「ナビゲーションアクセス」問い合わせ言語Versaである。主観的ではあるが、この選択はRDFデータの問い合わせのために考慮された多様な言語パラダイムを十分にカバーするものであると思われる。この比較が、さらなる類似の研究の動機付けと引き金となり、本論文の完成とその限界の克服につながることを、著者らは期待するものである。

  • Querying the Web with SPARQL

    セマンティックウェブについて、次の2つの概念を考えてみる。

    – 論理ベースの)知識表現のウェブ。

    – 半)構造化データのウェブ。

    どちらの概念においても、共通の要因(ウェブ)は、非常に可変的なスケーラビリティ(ホームページからコミュニティサイト、ウェブのかなりの部分を網羅するサイトまで)、急速な進化、過激な分布、任意の相互接続と集約、検証や他の管理手段のほとんどないことなどの要件を課している。Webの需要は、知識表現(KR)とデータベースの両コミュニティに、異なる方法で理解と技術の拡張を迫っている。

  • Composition of Rule Sets and Ontologies

    オントロジーやその他の論理ベースの仕様における大規模なルールセットを使いこなすには、それらを構成要素に分割する能力が重要な役割を果たす。ルールセットをブラックボックス化し、コンビネータで構成するという単純なアプローチでは、ルールセットの関係が複雑であるため、多くの場面で使い物にならない。その代わりに、構成要素は合成前に「開かれる」べきである。本論文では、このような「グレーボックス合成」技術として、フラグメントベースの汎用性と拡張、インラインテンプレート拡張、セマンティックマクロ、ミキシンレイヤーなどを紹介する。これらの手法は、大規模なオントロジーやルールベースの仕様を、きめ細かな構成要素に構造化するのに役立ち、そこから柔軟に構築することが可能である。

  • Reasoning with Rules and Ontologies

    セマンティックウェブのビジョンを実現するために、そのアーキテクチャを構成する各層を準備するための大規模な作業が進行中です。オントロジー層は、RDFやOWL Web Ontology LanguageなどのW3C勧告によって一定の成熟度に達しているため、現在の関心はルール層とそのオントロジー層との統合に集まっている。この問題を解決するためにいくつかの提案がなされているが、様々な障害があるため、一筋縄ではいかない。その一つは、ルール言語では一般的である閉じた世界の仮定などの評価原則が、オントロジーでは通常採用されないことである。さらに、オントロジーに素朴にルールを追加することは、決定不可能性の問題を引き起こす。本論文では、Semantic-Webスタックの現状とその構成要素について簡単に説明した後、ルール層を実現するための可能な形式として、回答集合意味論に基づく非単調論理プログラムについて述べる。また、ルールとオントロジーの組み合わせにおける未解決の問題について簡単に説明し、ルールとオントロジーを用いた推論を容易にするための既存の提案について調査する。次に、既存の推論エンジンによってサポートされるルールとオントロジーのトランスパレントな統合を実現する記述論理プログラム(略してdl-プログラム)に焦点を当て、回答集合セマンティクスに基づくルールとオントロジーの統合について述べる。さらに、dl-プログラムの一般化として、異なるオントロジーや高次の言語構成へのアクセスを提供するHEX-プログラムについて議論する。

  • Integrating Ontologies and Rules: Semantic and Computational Issues

    オントロジーとルールを統合した論理ベースシステムの定義に関する最近の成果を紹介する。特に、記述論理で表現されたオントロジーと、データログ(およびその非単調拡張)で押し出されたルールを考慮に入れている。まず、オントロジーとルールの統合で発生する主な問題を紹介する。特に、以下の側面に注目する。(i) 意味論的観点から、オントロジーはオープンワールド意味論に基づくが、ルールは通常クローズドワールド意味論の下で解釈される。この意味論的な矛盾は、オントロジーとルールの有意義な組み合わせを定義する上で重要な障害となる。(ii) 推論の観点から、オントロジーとルールコンポーネント間の相互作用は非常に扱いにくく、決定可能性と計算機的特性を保持しない。例えば、推論が決定可能であるオントロジーと推論が決定可能なルールベースから始めて、二つのコンポーネントを統合して得られる形式システムでの推論は決定可能な問題でない可能性もある。そこで、オントロジーとルールの統合のための主なアプローチを、上記の問題にどのように対処するかに重点を置いて簡単に概観し、そのうちの一つであるDL+logについて詳細に紹介する。最後に、この研究分野における主な未解決問題を説明し、オントロジーとルールを統合できる効果的かつ表現力豊かなシステムの開発を妨げているものを指摘する。

  • Business Rules in the Semantic Web, Are There Any or Are They Different?

    セマンティックウェブコミュニティとビジネスルールコミュニティは、共通のルーツを持っています。この記事では、標準化の取り組みや研究テーマに関して両者の連携を促進するために、両分野の相違点と類似点を探ります。

  • Ontologies and Text Mining as a Basis for a Semantic Web for the Life Sciences

    ライフサイエンス分野では、大規模なオンライン構造化・非構造化データリポジトリと、これらの知識を構造化するオントロジーが存在するため、セマンティックウェブ技術の有望な応用分野である。本論文では、バイオメディカルオントロジーの概要を説明し、バイオメディカルデータの検索、統合にどのように役立つかを示す。このようなオントロジーに基づく検索をサポートするために、文献にオントロジーの用語を付与することは重要な問題である。このテキストマイニングのステップをレビューし、オントロジーに基づく検索エンジンGoPubMedを紹介する。データソースが進化するにつれて、オントロジーも進化する。オントロジーの半自動的な進化をサポートする様々なアプローチについて簡単に説明する。

  • Integrating Web Resources to Model Protein Structure and Function

    この論文では、二次構造の予測、フォールディング、核磁気共鳴データからの構造決定、タンパク質相互作用のモデル化、代謝経路など、タンパク質の構造と機能に関する計算論的側面について述べる。このテーマは、タンパク質の構造と化学の概要、およびタンパク質構造のモデリングに使用されるアルゴリズムと表現で紹介されています。この論文の主な焦点は、構造データベースやモデリングサーバなど、タンパク質構造モデリングに関連するソースからの情報の統合です。この作業は、フォーマットの不均一性、データソースの多様性、および利用可能な情報の膨大な量によって困難になっており、データ共有用の標準フレームワーク(すなわちセマンティックWeb)の必要性を明白にしています。この問題を解決するために、セマンティックウェブの概念に基づいて開発されているツールを紹介します。UniProtRDFプロジェクトや、分子モデリングソフトウェアChemeraに実装され、インターネットサーバーやデータベースから得られる情報の検索や応用を容易にするツールなどがそれである。

  • Ontological and Practical Issues in Using a Description Logic to Represent Medical Concept Systems: Experience from GALEN

    GALENは、臨床システムにおいて再利用可能な用語リソースを提供することを目的としている。GALENの中心は、特殊な記述論理で定式化された共通参照モデル(CRM)である。CRM はプロジェクトの期間中に発展した一連の原則に基づいており、大規模な医学オントロジーが対処すべき主要な問題を示している。CRM の基礎となる原理について説明した後、実際に採用されているメカニズムについてより詳しく見ていきます。最後に、現在使用されている、あるいは提案されている他の生物医学オントロジーと構造を比較します。

セマンティックウェブ技術は、機械による多様で自動化された知識処理(推論など)をサポートするために、オントロジーを用いてドメイン知識を概念化・形式化する様々なアプリケーションでますます適用されています。さらに、(認知)人間の推論と(自動化された)機械の推論と処理の最適な組み合わせにより、人間と機械が補完的なタスクを共有することが可能である。その応用範囲は非常に広く、例を挙げると、企業ポータルや知識管理、電子商取引、eワーク、eビジネス、ヘルスケア、電子政府、自然言語理解や自動翻訳、情報検索、データやサービスの統合、ソーシャルネットワークや協調フィルタリング、知識マイニング、ビジネスインテリジェンスなど、多岐にわたる。社会的、経済的な観点から、この新しい技術は経済的な豊かさの成長に貢献する必要がありますが、同時に、技術の透明性と効率性によって、日常の活動に対して明確な価値を示す必要があります。セマンティックウェブ技術の産業・サービス分野への浸透は、徐々にではありますが、新たな成功事例が報告されるにつれ、加速しています。この論文と講演では、現在進行中の産学連携活動について紹介する。特に、セマンティックウェブ技術の有望性に関心を持つ企業の応用分野とユースケースを集めて紹介する。ユースケースは、選択したアプリケーション分野での技術展開を解く鍵となる知識処理コンポーネントに焦点を当てた詳細なものである。本論文の最後には、学術界と産業界の研究者のチームによって設計された現在の技術ロードマップが提示されている。

次回はReasoning Web 2007について述べる。

コメント

  1. […] 次回はReasoning Web2006について述べる。 […]

タイトルとURLをコピーしました