グローバルマッチングでのsimilarity(類似性)(5)確率的アプローチ

人工知能技術 ウェブ技術 知識情報処理技術 セマンティックウェブ技術   自然言語処理 機械学習技術  オントロジー技術 オントロジーマッチング技術

前回は類似性を計算する為の、期待値最大化と粒子群最適化の2つの手法について述べた。今回はそれらの確率的アプローチに拡張したものに対して述べる。

確率的マッチング
確率的手法は、オントロジーマッチングにおいて、利用可能なマッチング候補を増やすためなどに汎用的に使用されることがある。本節では、ベイジアンネットワークマルコフネットワーク、マルコフロジックネットワークに基づいたいくつかの手法を紹介する。確率的オントロジーマッチングの一般的な枠組みを下図に示す。

確率論的オントロジーマッチングの一般的な設定。マッチング問題はまず、ベイジアンネットワークやマルコフネットワークなど、特定の確率的な枠組みでモデル化する必要がある。モデル(ネットワーク)の初期化は、基本的な尺度で計算されたシードマッチや、エンティティのペア間の初期の部分的なアラインメントを使用して実行さる。構築されたモデルで確率論的推論を行い、強化されたモデルを計算し、最終的にアライメントとして抽出することができる。

ベイジアンネットワーク
ベイジアン・ビリーフ・ネットワークまたは単にベイジアン・ネットワークは、原因と結果をモデル化するための確率的なアプローチとなる。ベイジアンネットワークは、(1)ノード(変数とも呼ばれる)とアーク(辺)を含む有向非環状グラフ、および(2)条件付き確率表のセットから構成される。ノード間のアーク(辺)は,条件付きの依存関係を表し,影響の方向を示す.例えば,ノードX1(親と呼ぶ)からノードX2(子と呼ぶ)へのアーク(辺)は,X1がX2に直接影響を与えることを意味する.あるノードが他のノードにどのように影響を与えるか(過去の経験に基づいて)は、ノードの条件付確率表によって定義される。P (X|parents(X))は,変数Xの条件付き確率であり,parents(X)は,Xに直接影響を与えるすべてのノードと唯一のノードの集合である. グラフと条件付き確率表によって,すべての変数の結合確率分布,すなわち

\[ P(X_1,\dots,X_n)=\displaystyle\prod_iP(X_i|parents(X_i)), \ \ i=1,\dots,n\]

上式より、あるノードの値が与えられれば,他のノードの値の確率分布を推論することができる.最も単純なケースでは、専門家がベイジアンネットワークを指定し、ノードのいくつかの値が観測可能になった後、それを使って推論を行い、予測や原因の診断を行うことができる。すべての変数が観測可能でない場合、変数間の依存性を特定する必要があるが、これはデータに適合するベイジアンネットワークを学習することで解決することができる(Russell and Norvig 1995)。
ベイジアンネットワークはモデル化され、オントロジーマッチングに様々な形で利用されている。例えば、2つのオントロジーは2つのベイジアンネットワークに変換され、マッチングはこれらのベイジアンネットワーク間の証拠に基づく推論として実行される(Pan et al. 2005)。また、(Mitra et al.2005)は、ベイジアンネットワークを用いて、ミスマッチを導き出すなどして、既存のマッチングを強化している。後者について、より詳細に述べる。

ベイジアンネットワーク、(Mitra et al. 2005)より引用)した例。ベイジアンネットワークは対応関係で構築され、各対応関係が他の関連する対応関係にどのように影響するかを表現するオントロジー言語のセマンティクスに基づいたメタルールを使用する。外部のマッチャーが対応関係の初期確率分布を生成するように適応され、それが他の対応関係の確率分布を推論するために使用される。

ベイジアンネットワークグラフ。各ノードはオントロジーエンティティ間の対応関係を表している。点線の矢印は、オントロジー内のこれらのエンティティ間の関係を表しており、これにより、平線の矢印で表される対応関係間の影響関係が誘発される。

ベイジアンネットワーク・グラフのノードは、2つの異なるオントロジーのクラスやプロパティのペアのマッチを表している。ベイジアンネットワークグラフの実線の矢印はノード間の影響を表し、点線の矢印は対象となるオントロジーの関係を表している。例えば,プロパティ hasWritten ∈o と creates ∈o′ の対応は,それらが範囲 Writer ∈o と Creator ∈o′ として持つ概念の対応に影響を与え,その結果,author ∈o と hasCreated ∈o′ の対応に影響を与える。条件付確率表は、親ノードの確率分布に応じて子ノードの確率分布が影響を受けるというルールなど、一般的なメタルールを利用して生成される。例えば,2 つの概念 Writer と Creator が一致し,o の中の Writer と Text の間に hasWritten という関係があり,o′の中の Creator と Work の間に author という関係がある場合,o の中の Text と o′の中の Work の間の一致の確率を高めることができる.子ノードの確率分布は、定数を用いて親ノードの確率分布から脱却される。ベイジアンネットワークを実行すると,各ノードの事後確率が生成される.

マルコフ・ネットワークとマルコフ・ロジック・ネットワーク
次に、マルコフネットワーク(Pearl 1988)とマルコフロジックネットワーク(Richardson and Domingos 2006)について説明する。これらはそれぞれ、(Albagli et al. 2012)と(Niepert et al. 2010)がオントロジーマッチングに利用している。
マルコフネットワークは、構造化された確率的なネットワークとなる。マルコフネットワークは,ベイジアンネットワークと同様に,N = ⟨V , E⟩と表され,変数を表すノード(V)と,変数間の統計的依存関係を表すノード間のエッジ(E)から構成されている.具体的には、マルコフネットワークは、変数で表現されるイベントに対する共同確率分布を表している。ベイジアンネットワークとは異なり、マルコフネットワークは無向性になる。マルコフネットワークの確率分布は、すべてのペアが少なくとも1つのエッジで接続されているようなクリーク(C)、すなわちノードの集合に対するポテンシャル関数(p)によって定義される。ポテンシャルまたはテーブル(pC )は、ネットワークの各完全なサブグラフに関連付けることができまる。これらはベイジアンネットワークの条件付確率に相当する。マルコフネットワークで定義されるイベント確率の合同分布は、すべてのポテンシャルの積、すなわち以下のようになる。

\[ P(N)=\frac{1}{Z}\displaystyle\prod_{C\in cliques(N)}p_c(C)\]

Zは正規化定数で、分割関数としても知られている。

マルコフネットワークの例。 オントロジーのペアが与えられれば、対応するマルコフネットワークを構築する必要がある。図6.6の例と同様に、このようなネットワークは対応関係を用いて構築することができるが、実線の矢印は無向性のエッジで置き換える必要がある。ネットワークのトポロジーを管理するルールとしては、「2つのクラスが一致する場合、対応する親クラスも一致することが多い」などが考えられる。エビデンスポテンシャルは、例えば編集距離やユーザーとのインタラクションを通じて計算された、エンティティの全ペア間の類似性測定によって初期化することができる。構築されたネットワークでは、確率的な推論が実行され、それによって強化されたアラインメントが計算される。推論は、ギブスサンプリングなどのモンテカルロ法や、信念伝搬とも呼ばれる事後マージンの計算によって行うことができる。推論は反復して行うこともできるし、事後確率の閾値を用いてネットワークからアライメントを抽出することもできる。

マルコフ論理ネットワーク(MLN)は、マルコフネットワークと一階論理を統合したものとなる。このようなネットワークでは、ノードは原子式を表し、クリークは式の基底を表す。マルコフネットワークの特殊なケースとして、対数線形モデルを考えてみると。この場合、ポテンシャルは、重みを持つ特徴(公式)のセットに置き換えられる。対数線形モデルの確率分布は以下のようになる。

\[ P(x)=\frac{1}{Z}exp(\displaystyle\sum_i w_if_i(x))\]

Zは正規化定数、wiは特徴iの実数値の重み、fi(x)はi番目の特徴または一次論理式となる。このように、マルコフ論理ネットワークは、(グラフ構造を決定する)一階論理式に重みをつけたものとなる。式の接地は、式のすべての変数を定数で置き換えることによって得られる。ある式が真であるという根拠が高ければ高いほど、その重みは大きくなる。このように、重みは、式の解釈がどの程度硬いか、または軟らかいかを示す。これにより、不確実性への対応が可能になる。つまり、時として公式に反するような状況では、そのような公式の可能性は低くなるが、それでもある程度は潜在的な対応関係を表すことができる。

マルコフロジックネットワークの例。 オントロジーマッチングにマルコフロジックネットワークを使用すると、証拠が与えられたときに、最も確率の高いアラインメントを計算することができる。入力されたオントロジーは真の知識であると仮定され、そのため、すべてのアラインメントで成立するべきハードな制約としてエンコードされる。初期のエビデンスや重みは、マッチングされるエンティティ間のシードアラインメントを使用して得ることができる。次に、可能性のあるアラインメントについて事後的な確率を計算する。例えば、最大事後確率の推論は、整数線形計画法を用いて行うことができる。この問題の定式化では、最大化すべき目的関数は以下のようになる。0.88f1 + 0.1f2 + 0.75f3, ここで、f1は文書と文書などのエンティティ間の対応関係を表し、f2は提供者と翻訳者などの対応関係を表す。重みは、これらのエンティティ間の規範的な類似性を表している。これらの先験的な類似性は、0.5よりも高いなど、特定のしきい値を超える必要があるかもしれない。f1 + f3 ≤ 1のような整数論理プログラムの制約は、カーディナリティ(一対一)、コヒーレンス(論理的矛盾の回避)、構造的伝播(Similarity floodingの精神に基づく)を符号化するために使用される。最適解によって返される変数の値(fi)は、最終的な類似性に対応する。

確率的マッチングのまとめ
他の多くの分野と同様に、確率的モデリングはオントロジーマッチングに取り入れられ、効果的に利用されている。しかし、特に先験的な確率の取得方法や、確率モデルの構築方法については、まだ課題が残っている。先験的な確率については、構文的な類似性ではなく、アライメントを適用するタスクに基づいて算出する方がより正確であることは確かとなる。
しかし、オントロジーマッチングの確率的基盤をよりよく理解するためには、さらに多くの作業が必要になる。特に、確率的な推論をアライメントやオントロジーの構造やセマンティクスと組み合わせる必要がある。これは、論理と確率の結合という、より一般的なトピックにつながるものであり、次のセクションで紹介する意味論的なテクニックにもつながるものとなる。

次回は意味的アプローチについて述べる。

コメント

  1. […] 自然言語の類似性(similarity)(10) 確率的アプローチ […]

  2. […] 次回は確率的手法について述べる […]

  3. […] グローバルマッチングでの類似性(similarity)(5) 確率的アプローチ […]

  4. […] 前回は類似性を計算する為に、確率モデルであるベイジアンネットワークモデル、マルコフモデル、マルコフロジックネットワークのアプローチについて述べた。今回は意味的アプローチに対して述べる。 […]

  5. […] さらに「データストリーム(時系列データ)の機械学習とシステムアーキテクチャ」に述べられているように、それらの判定されたデータをさらにオントロジー等のデータと組み合わせてリアルタイムの推論を行なわせたり、「グローバルマッチングでのsimilarity(類似性)(5)確率的アプローチ」に述べによあな確率的な推論(マルコフロジックネットワーク)を行うこともできる。 […]

  6. […] 5.グローバルマッチングでの類似性(similarity)(5) 確率的アプローチ […]

モバイルバージョンを終了
タイトルとURLをコピーしました