Reasoning Web 2005論文集について

機械学習技術　人工知能技術　自然言語処理技術　セマンティックウェブ技術　オントロジー技術　デジタルトランスフォーメーション技術 AI学会論文 知識情報処理技術 AI学会論文を集めて 推論技術

今回は、2005年7月25日から29日にかけて開催されたサマースクール「Reasoning Web」(http://reasoningweb.org)のチュートリアルペーパーを収録している。

このスクールは、マルタ大学が主催し、Network of Excellence REWERSE “Reasoning on the Web with Rules and Semantics” (http://rewerse. net) が主催した。EU委員会とスイス連邦教育科学庁の資金援助を受け、プロジェクト参照番号506779で6th Framework Programmeが実施された。このスクールの目的は、World Wide Web Consortium W3Cが重要な役割を果たしている、現在のWeb研究の主要な試みであるセマンティックWebの手法と問題点について紹介することとなる。

セマンティックウェブの主な考え方は、データの「意味」を伝えるメタデータでウェブデータを豊かにし、ウェブベースのシステムがデータ（とメタデータ）について推論できるようにすることとなる。セマンティックウェブアプリケーションで使用されるメタデータは、通常、異なるアプリケーションで共有されるアプリケーションドメインの概念にリンクされている。このような概念化はオントロジーと呼ばれ、オブジェクトのクラスとそれらの間の関係を規定する。オントロジーは、論理学に基づき、形式的な推論をサポートするオントロジー言語によって定義される。現在のウェブがデータフォーマットとデータセマンティクスにおいて本質的に異質であるように、セマンティックウェブはその推論形態において本質的に異質となる。つまり、セマンティックウェブでは単一の推論形式では不十分であることが判明している。例えば、一般にオントロジー推論は単調な否定に依存するが、データベース、ウェブデータベース、ウェブベースの情報システムは非単調な推論を要求している。時間を扱うには制約推論が必要である（時間間隔が扱われるため）。トポロジーを用いた推論、例えば、モバイルコンピューティングのアプリケーションでは、計画法が必要となる。一方、（前方および後方）連鎖は、データベースのようなビューを扱う推論である（ビュー、すなわち、仮想データは、結合や投影などの操作によって、実際のデータから導出することができるため）。

スクールのプログラムと講師の選定は、REWERSE運営委員会で議論され、承認されました。本書は、講師陣の執筆または共著による10本の論文を収録しています。論文では、セマンティックウェブの基礎と、REWERSEが取り組む研究課題の一部を紹介しています。

最初の2つの論文は、セマンティックウェブのオントロジーレベルに関するものです。Grigoris Antoniou、Enrico Franconi、Frank van Harmelenによる論文は、セマンティックWebのオントロジー言語について紹介し、記述論理との関連について論じている。セマンティックWeb推論のための代替基盤は、Michael Kiferの論文で議論されているように、F-logicである。

次の2つの論文は、情報システムとしてのウェブの視点である。最初の論文はJames Bailey, Fran ̧ Bry, Tim Furche, Sebastian Schaffertの共著で、標準的なWebとSemantic Webの主要な表現形式のためにこれまでに提案されたほとんどのWebとSemantic Webクエリー言語について調査している。XML、RDF、トピックマップである。この調査では、様々な形式で表現されたWeb上のデータへの統合的なアクセスの必要性を強調し、Webデータのクエリにおける推論の役割について議論している。本論文は本編の他の論文に比べて規模が大きい。これは、多数のWeb問合せ言語について包括的かつ重点的に調査するために必要であった。2番目の論文は，Jos ́e Ju ́lio AlferesとWolfgang Mayによるもので，Webデータの進化とイベントへの反応性の問題を取り上げている。この論文では、まず、一般的な進化と反応言語の論理的基礎について論じ、次に、WebとセマンティックWebにおける進化と反応性に特有の問題に焦点を当てている。

Webの使い勝手は次の2つの論文で扱われる。最初の論文は、Matteo Baldoni、Cristina Baroglio、Nicola Henzeによるもので、セマンティックWebにおけるパーソナライゼーションの問題を論じている。パーソナライゼーション技術は、情報へのアクセス、検索、保存においてユーザーに最適なサポートを提供することを目的としており、個人の嗜好、特性、好みに合わせたソリューションが構築される。本論文の目的は、セマンティックウェブにおけるパーソナライゼーションを実現するための課題と方法について、一貫した紹介を行うことである。この論文では、パーソナライゼーションに推論が不可欠であることを示している。Nor- bert Fuchs, Stefan Ho ̈fler, Kaarel Kaljurand, Fabio Rinaldi, and Gerold Schnei-der による論文は、人間と機械が読むことができる知識表現言語Attempto Controlled English (ACE) の体系的な紹介をしている。ACEは、英語の非曖昧な部分集合の構文を持つ一階論理言語と見なすことができる。ACEはすでに形式システムのインターフェース言語として使用されており、ビジネスやポリシーのルールを表現する能力から、セマンティックウェブアプリケーションに最も適した言語であるといえる。

この巻の残りの論文は、セマンティックWebといくつかの確立された技術との間の重要なリンクの可能性を示している。Gerd Wagner氏の論文は，OMG（Object Management Group）が提唱するUML（Uni-fied Modeling Language）をベースにしたルール・モデリングに関するいくつかの問題点を取り上げている。UMLのクラスモデルとW3Cのオントロジー言語OWLのボキャブラリーとの類似点、相違点を論じている。また、UMLがルールの指定や、RDF、OWL、セマンティックWebルール言語などのセマンティックWeb言語の抽象構文の簡潔な記述にどのように利用できるかを示している。Robert Baumgartner, Thomas Eiter, Georg Gottlob, Marcus Herzog, Christoph Kochによる論文は、Web情報抽出の技術と現状を調査し、セマンティックWebアプリケーションの入力データ作成におけるそれらの重要性を説明するものである。Uwe Aßmann氏の論文は、オントロジーの採用がソフトウェアの再利用率を高めることを示し、オントロジーがソフトウェアアプリケーションの構築において重要な役割を果たすと結論づけている（単数または製品ラインの両方）。これは、標準的なアプリケーションだけでなく、Webサービスを含むWebアプリケーションにも関係する。最後に、Wlodzimierz Drabent氏の論文では、Webルールやクエリ言語には型チェックが必要であると論じている。そのために、この論文では、半構造化データの集合を記述するためのフォーマリズムを提示している。このような集合は、DTDやXML Schemaなどのスキーマ言語で記述されたXMLスキーマと関連しており、型として使用することができる。現在、REWERSEルール言語の型チェックへの適用に関する研究が進められている。

Introduction to Semantic Web Ontology Languages

本章の目的は、セマンティックウェブで重要な役割を果たすオントロジー言語のいくつかを一般に紹介し、これらの言語の形式的基盤について議論することである。ウェブオントロジー言語は、私たちが共有し、統合したいと思う情報の主な担い手となるであろう。

Rules and Ontologies in F-Logic

F-logicは、論理とオブジェクト指向プログラミングをすっきりと宣言的に統合する形式主義である。情報統合、オントロジーモデリング、エージェントベースシステム、ソフトウェアエンジニアリングなどに利用され、成功を収めている。本論文では、F-logicの概要を説明し、オントロジー言語の観点からその特徴を論じる。
Web and Semantic Web Query Languages: A Survey

WebやセマンティックWeb上で強力なデータ検索を実現するために、さまざまな技術が開発されている。ウェブクエリー言語は、検索可能なデータの形式によって3つのカテゴリーに分けられる。XML、RDF、トピックマップである。本論文では、これらのカテゴリに分類される言語を紹介し、その主要な側面を要約する。各言語は、共通のサンプルデータとクエリタイプを使用して紹介されている。結論として、クエリ言語の重要な側面が強調されている。
Evolution and Reactivity for the Web

ウェブやセマンティックウェブは、自律的に進化するデータソースを組み合わせ、それぞれが認識した事象に反応する「生命体」として理解することができる。データソースのウェブというよりは、情報システムのウェブを想定している。そのようなシステムは、情報を収集する能力（永続的なデータへの問い合わせや、発生するイベントなどの不安定なデータの「聴取」）のほかに、永続的なデータを更新し、変更を伝え、他のシステムで永続データの変更を要求し、他のシステムからの要求に対して反応することが可能である。このようなWebの動的特性から、データの進化を指定するための宣言型言語とメカニズムが必要となる。

このコースでは、一般的に進化と反応性言語の基礎について話し、その後、ウェブとセマンティックウェブにおける進化と反応性がもたらすいくつかの具体的な問題に集中的に取り組みます。
Personalization for the Semantic Web

一般的な検索エンジンで「パーソナライズ」という言葉の意味を調べると、「Webサーバーへのページ要求時に、ビジネスルールに基づいて分類されたコンテンツを異なるエンドユーザーに適合させるプロセス」「コンテンツやサービスを個人に適合させるために、継続的に調整されるユーザープロファイルを使用」、さらには「ディスプレイ、特にWebページを、特定の顧客が以前に購入したものなどの既知の好みにリアルタイムに合わせる」など、23の異なる回答が出てきます。もう少し一般的に言うと、パーソナライゼーションとは、情報のアクセス、検索、保存においてユーザーに最適なサポートを提供するプロセスであり、個人の嗜好、特性、好みに合わせてソリューションを構築することである。この結果は、機械が解釈可能な意味情報を利用することによってのみ達成することができる。パーソナライゼーションは、意味情報に適用される推論プロセスによって実現され、それは特定のタスクに応じて多くの異なる方法で実行することができる。本論文の目的は、セマンティックウェブでパーソナライゼーションを実現するための問題と方法について首尾一貫した紹介を行うことである。
Attempto Controlled English:A Knowledge Representation Language Readable by Humans and Machines

Attempto Controlled English (ACE)は、英語の構文を持つ知識表現言語である。ACEは英語の構文を持つ知識表現言語であるため、形式的な表記に慣れ親しんでいなくても、誰でも使うことができる。At- tempto Parsing EngineはACEのテキストを一階論理の変形である談話表現構造に変換する。したがって、ACEは完全な一階論理に相当する論理言語であることがわかる。このように、自然言語と論理言語という2つの視点は、ACEを人間にも機械にも読みやすいものにするために、互いに補い合うものである。本論文では、ACEの両観点について述べる。第1部では、ACEという言語を簡単に紹介し、第2部では、ACEテキストから得られる談話表現構造の概要を説明する。
Rule Modeling and Markup

この論文では、UMLをベースとしたルールモデリングに関するいくつかの問題を取り上げる。UMLのクラスモデルとOWLボキャブラリーとの関係について述べる。また、OCLの助けを借りて、特定のルールをクラス図で指定する方法を示す。また、UMLクラス図を用いて、ルール概念をどのように記述し、RDF、OWL、SWRL、RuleMLの抽象構文をどのように定義することができるかを簡潔に示す。
Information Extraction for the Semantic Web

World WideWebは、知識・情報の宝庫です。しかし、残念ながら、必要な情報を検索し、アクセスすることは容易ではありません。そのため、必要な情報にアクセスし、抽出し、変換し、共有するための言語とツールが必要である。ウェブは人間が消費するだけでなく、機械とのコミュニケーションにも役立つものでなければならない。そのため、様々な異なるWebソース、一般的には様々な異種ソースから情報を抽出し、統合するための表現言語に基づいた強力かつ使いやすいツールが必要である。このチュートリアルでは、この文脈で必要とされるWeb技術を紹介し、情報抽出と統合に用いられる様々なアプローチと技術を紹介する。さらに、様々なドメインでのサンプルアプリケーションは、議論されたトピックを動機付け、セマンティックWebのためのデータインスタンスを生成することが例示されている1。
Reuse in Semantic Applications

セマンティック技術を用いたアプリケーションは、他のソフトウェア製品と基本的に異なるものではありません。標準的なアプリケーションとして、よく定義された開発プロセス、適切なモデリング技術、そして構築コストを削減するために、モデルやコンポーネントの優れた再利用技術が必要である。本論文では、オントロジーを採用することで、再利用率を高めることができることを示す。オントロジーは、オブジェクト指向ソフトウェア開発における改良プロセスの改善、製品ラインの設計の簡素化、コンポーネントベースのシステムにおける相互運用性の向上、Webサービスなどのサービスベースのアプリケーションに役立つ。したがって、オントロジーは今後のソフトウェア製品のエンジニアリングにおいて重要な役割を果たすことになる。

Towards Types for Web Rule Languages

ウェブ文書の（クラスを）記述するために、様々なスキーマ言語が導入されている（DTD、XML Schema、Relax NG）。ここでは、それらの主な特徴について数学的な処理を行う。我々はスキーマが定義する文書の集合に興味があり、そのような集合を型と呼ぶことにする。数学的形式を用いることで、スキーマ言語の選択された側面を正確かつシンプルな方法で議論することが可能になる。そうでなければ、大規模で洗練されたスキーマ言語の多数の詳細の中に隠されてしまうからである。我々の目標はルール言語の型付けであり、より正確には、型によってその意味論をおおよそ記述することである。そのため、ルールの型チェックや型推論に必要な型に対する操作を実行する（効率的な）アルゴリズムを構築するための型の形式論に興味があります。

次回はReasoning Web2006について述べる。

Deux Ex Machina

AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。

Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.