Inductive logic Programming 2018論文集より

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術  知識情報処理技術  AI学会論文を集めて   推論技術

前回はILP2017について述べた。今回はイタリア/フェラーラで開催されたILP2018について述べる。

帰納論理プログラミング(ILP)は機械学習のサブフィールドであり、例、背景知識、仮説を表現するための統一された表現言語として論理プログラミングに依存しています。一階述語論理に基づくその強力な表現形式により、ILPは多関係学習とデータマイニングのための優れた手段を提供します。

1991年に開始されたILP会議シリーズは、構造化または半構造化されたリレーショナルデータから学習するための最高の国際フォーラムです。もともとは論理プログラムの導入に焦点を当てていましたが、長年にわたって研究範囲を大幅に拡大し、論理、多関係データマイニング、統計的関係学習、グラフおよびツリーマイニング、その他の学習(非-提案)論理ベースの知識表現フレームワーク、統計的学習およびその他の確率論的アプローチとの交差点を調査します。

機械学習研究において、確率論的モデリングは主要なアプローチである。この分野が発展するにつれ、対象とする問題はますます困難で複雑になってきている。実世界の問題で複雑な決定を下すには、しばしば相互依存する変数の集合に値を割り当てることが必要であり、依存関係の表現構造はどのような割り当てが可能かに影響を与え、あるいは指示することができる。しかし、非局所的な依存関係を確率モデルに取り込むと、学習や推論が困難になることがある。本論文では、モジュール性と学習の扱いやすさを維持しつつ、表現力豊かな出力空間での決定を支援する方法として、宣言的制約で確率モデルを補強するフレームワークである制約条件モデル(CCMs)を提示する。さらに、宣言的制約を用いることで、確率モデルの学習時にラベル付けされていないデータを利用できることを示す。

あるゲームに特化したチャンピオンレベルのシステムの設計は、人工知能のマイルストーンと考えられてきた。ブリッジは部分的に観測可能なゲームであり、ブリッジプレーヤーは自分の行動の意味を相手に説明する必要があるためである。本論文では、ブリッジにおける単純な教師付き学習問題を提示する。すなわち、「リミットハンド」が与えられたとき、プレイヤーは自分のハンドとその決定の文脈のみを考慮してビッドすべきか否かを決定する。この問題とそのモデル化の候補をいくつか説明する。そして、この問題に対して、最新の命題型機械学習とILPシステムを用いて実験を行う。これらの予備実験の結果、ILPシステムは命題型機械学習システムに匹敵するか、あるいはそれを凌駕することがわかった。さらに、ILPシステムは、Bridgeの専門家によって検証された明示的なモデルを構築することが可能である。

ディープリレーショナルマシン(DRM)は、複雑なドメイン知識をディープネットワークに取り込むためのシンプルな方法である。DRMでは、この知識は関係素性を通して導入される。[1]の最初の定式化では、論理プログラムとしてエンコードされたドメイン知識を用いて、ILPエンジンによって素性が選択される。最近では、[2]で、ILPエンジンによる素性選択を必要としないDRMが登場している(素性は単に関連素性の空間からランダムに抽出される)。しかし、これまでのDRMの報告には、3つの点で不十分な点がある。(a)非常に少ないデータでテストされている(7つのデータセット、全て独立ではなく、全部で数千インスタンス) (b)背景知識は数十個の述語からなる控えめなものである (c)性能評価は分類タスクのみである。本論文では、生化学分野のデータセットを用いて、数百から数千のインスタンス、複雑な定義の多階層を含む強力な背景述語、および分類と回帰タスクでテストすることにより、これらの欠点を修正した。その結果、DRMの予測能力が実質的に信頼できるものであること、また、ドメイン知識を取り入れることで予測能力が大幅に向上することを確認した。我々は、新しいデータセットと結果を、ニューラル・シンボリック・モデリングの比較研究のための最新のベンチマークとして提案する。

我々は、潜在的な関係構造を学習するためのフレームワークであるLifted relational neural networksの言語で表現されたチーム埋め込み概念を提案し、スポーツ予測分析の領域における関係学習の利用を研究している。サッカーの試合結果に関する大規模なデータセットを用いて、様々な関係性学習手法をこの分野の強力な現行手法と比較し、埋め込み学習と組み合わせた場合の関係性アプローチの非常に有望な結果を示す。

記号的な複雑事象を認識するシステムでは、論理的なルールの形で事象の定義を行い、時間内に発生した事象を検出する。イベントカリキュラスは、イベント認識アプリケーションの基礎として使用されてきた時間論理であり、データからこのようなルールを学習する技術につながるものである。我々は、既存の関係構造を学習するオンラインアルゴリズムとマルコフ論理回路網(MLN)の重み学習のためのオンライン手法を組み合わせることで、最先端技術を進歩させる。その結果、MLNセマンティクスにおけるイベントカルキュラス理論の形で複雑なイベントパターンを学習するアルゴリズムが得られる。我々は、活動認識のための困難な実世界のアプリケーションで我々のアプローチを評価し、学習時間が少し増加する代償として、予測性能の点でそのクリスプな前任者と競合するオンラインMLN学習者の両方を凌駕することが示される。

臨床テキストから臨床実体とその関係を抽出することは、医療知識グラフを構築するための予備的な作業である。既存のエンドツーエンドモデルでは、潜在的な構文情報と文脈情報の影響の両方を考慮することがほとんどないため、臨床テキストにおける実体と関係の抽出性能は限定的である。そこで、本論文では、臨床テキストからエンティティ間の関係を抽出するために、2レベルのアテンションを持つコンテキストアウェアなエンドツーエンドニューラルモデルを提案した。実体レベルの注意は、対象実体をルートとする子単語ノードの加重和を学習することで、より多くの構文情報を効率的に獲得できることを示す。一方、文レベルの注意は、1文中の各文脈表現の重みを割り当てることにより、対象実体と文脈実体の組の間の相互作用を捕捉することを試みる。上海瑞金病院の実臨床テキストを用いた実験により、本モデルが臨床テキストの応用において、既存のジョイントモデルと比較して有意に優れた性能を獲得することが実証された。

本論文では、一般的な確率推論タスク(演繹型確率推論や仮説重み付け学習など)を主なユースケースとした、SAT立会や解答集合サンプリングによる多モデル最適化を提案する。我々のアプローチは、最新のSAT/ASP解法アルゴリズムを、分岐リテラルの決定アプローチとしてGradient Descentを、またオプションとしてコストバックトラックメカニズムを強化したものである。これらの方法を用いたモデルのサンプリングは、与えられた論理的背景知識(CNFのブール式または安定モデル意味論下の通常の論理プログラム)を遵守しながら、タスク固有の、ユーザが提供する多モデルコスト関数を最小化するものである。本フレームワークの特徴として、任意の微分可能なコスト関数と背景知識を与えることができるため、比較的単純でありながら高い表現力を持つことが挙げられます。

近年、帰納論理プログラミング(ILP)の手法を拡張し、回答集合プログラム(ASP)を誘導する研究が盛んに行われています。これらの手法は、ILPの問題インスタンスをASPのプログラムとして符号化し、正しい仮説を網羅的に探索する。しかし、網羅的な探索はスケーラビリティを損ないます。また、これらの手法で採用されている言語バイアスは、過度に制限的である。本論文では、単一の安定モデルを持つ層化解集合プログラムの学習を、複数の安定モデルを持つ任意の(すなわち非層化)解集合プログラムの学習に拡張する。この拡張アルゴリズムは貪欲なFOILライクアルゴリズムであり、非単調論理プログラムを誘導することができる。その例として、グラフカラーリングやN-queensなどの組合せ問題に対するプログラムを誘導することができる。我々の知る限り、これは複数の安定モデルを持つ答集合プログラムを誘導する最初のヒューリスティックベースのILPアルゴリズムである。

従来、帰納論理プログラミング(ILP)の分野では、Prologプログラムの学習問題を扱うことがほとんどであった。一方、回答集合プログラミングは、知識表現と推論のための強力な言語として、産業界でも注目されるようになってきている。その結果、ILPの研究活動は回答集合プログラミングの領域にも広がり、ILPを回答集合プログラムの学習に拡張した新しい学習フレームワークがいくつか提案されています。本論文では、これらの既存のフレームワークの理論的性質を調査し、答集合セマンティクスの下でプログラムを学習する。具体的には、仮説が学習課題の解であるかどうかの決定と、学習課題が解を持つかどうかの決定の2つの決定問題に関して、これらのフレームワークの計算複雑度を詳細に分析する。我々は、学習フレームワークの一般性という新しい概念を導入することで、あるフレームワークが、不正なASPプログラムの集合から一つのASP仮説解を区別することができるという点で、他のフレームワークよりも一般的であると定義することができるようにする。この概念に基づき、回答集合セマンティクスの下でのプログラム学習のための既存のフレームワークの集合に対する汎化関係を正式に証明する。特に、我々が最近提案したフレームワーク、Context-dependent Learning from Ordered Answer Setsは、brave induction, induction of stable models, cautious inductionよりも一般的であり、これらのフレームワークの中で最も高い複雑度を持つcautious inductionと同じ複雑度を維持することを示す。

セマンティックウェブ知識表現規格、特にRDFやOWLには、この分野では基本的に重要だと考えられている形式的意味論が付与されていることが多い。推論、すなわち、このような規格で表現された知識から論理的な推論を行うことは、伝統的に、健全かつ完全で終端的、すなわち非常に強い意味で正しいことが証明できる論理的演繹法とアルゴリズムに基づくものである。しかし、様々な理由、特に、増え続けるセマンティックウェブデータから生じるスケーラビリティの問題や、演繹的アルゴリズムがデータ中のノイズに対処できないことから、高いスケーラビリティとより良い堅牢性が期待できる別の推論手段を研究すべきであると主張されてきた。この観点から、演繹的アルゴリズムは、代替手段をテストする必要がある、正しさに関する金字塔と考えることができる。本論文では、RDF知識グラフ上でディープラーニングシステムを訓練することが可能であり、演繹的ゴールドスタンダードと比較して高い精度と再現率で、新しいRDF知識グラフ上で推論を実行することができることを示す。

データからプログラムを機械学習する場合、非効率的なプログラムではなく、効率的なプログラムを学習することが理想的である。しかし、既存の帰納論理プログラミング(ILP)技術は、順列ソート(n!)やマージソート𝑂(𝑛𝑙)などのプログラムの効率を区別できない。この制限を解決するために、仮説空間をさらに制限しながらより低いコストの論理プログラムを繰り返し学習するILPシステム、Metaoptを紹介する。十分な数の例題が与えられれば、Metaoptは最小コストのプログラムに収束することを証明し、実験により、実際には少数の例題しか必要としないことを示す。非決定論的プログラムを含む時間的複雑性が最小のプログラムを学習するために、我々は、プログラムがゴールを与えられたときに探索されるSLD-木の大きさを測定するツリーコストと呼ばれるコスト関数を導入している。プログラミングパズル、ロボット戦略、実世界の文字列変換問題に対する実験から、Metaoptが最小限のコストのプログラムを学習することが示された。我々の知る限り、Metaoptは十分な数の学習例が与えられた場合に、最小時間複雑度プログラムを含む最小コスト論理プログラムの学習を保証する最初の機械学習アプローチである。

メタ解釈学習(MIL)は帰納論理プログラミングの一種である。MILは宣言的バイアスの一形態として、メタルールと呼ばれる2次ホーン節を用いる。メタルールは学習可能なプログラムの構造を定義し、その結果、仮説空間を定義する。どのメタルールを使うかは、効率と表現力のトレードオフである。メタルールを増やすと仮説空間が増大するため、メタルールを少なくしたいが、メタルールを少なくしすぎると表現力が低下する。最近の論文では、Progolの含意削減アルゴリズムを用いて、メタルールの既約集合、つまり最小限の集合を特定することに成功した。いくつかのケースでは、わずか2つのメタルールで無限言語の全仮説を包含できることが示された。さらに、最小でない集合と比較して、メタルールの最小集合を用いた学習は予測精度を向上させ、学習時間を短縮させることが示された。本論文では、含意関係削減が強すぎて、仮説をより具体的にするために必要なメタルールを削除してしまうことがあることを示す。本論文では、導出に基づく新しい削減手法を説明する。具体的には、導出削減問題(SLD-resolutionを用いて理論全体を導出できるホーン理論の有限部分集合を求める問題)を導入する。また、メタルールの集合を削減するために用いる導出削減アルゴリズムについて述べる。また、あるメタルールの集合が導出的に最小の有限部分集合に還元できるかどうかを理論的に研究する。実験では、メタルールの含意と導出削減された集合を用いた学習を比較する。一般に、導出削減されたメタルールの集合を用いた学習は、予測精度と学習時間の両方において、含意削減されたメタルールの集合を用いた学習より優れている。

科学において、実験とは競合する仮説の仲裁と知識の獲得を可能にする経験的な観察である。エージェント戦略の学習を目的とする科学者にとって、実験を行うことはエネルギーコストとなる。そのため、学習プロセスの効率は、実行された実験の数に依存する。本稿では、効率的なエージェント戦略を学習するための能動学習によって、実験のコストをどのように削減できるかを検討する。我々は、仮説空間上にベイズ型事後分布を割り当てるメタ解釈学習の枠組みの拡張を考える。各反復において、学習者は最大エントロピーを持つインスタンスのラベルを問い合わせるが、それは残りの競合仮説に対して最も弁別的であり、したがってバージョン空間の最も高い縮小を達成することができる。我々は理論的な枠組みを研究し、正規文法とエージェント戦略を学習するタスクの実験コストに対する利得を評価する。我々の結果は、任意の精度レベルに達するために行うべき実験回数が少なくとも半分になることを示す。

帰納論理プログラミングの応用では、適切な背景知識を選択することが重要である。従来、このような背景知識の選択は、ILPシステムが仮説を立てるために使用する原始的な述語を提供する人間に完全に依存していた。本論文では、既存の述語の大規模なライブラリから背景定義を自動選択する可能性に 関する問題を検討する。特に、背景定義の一般性が誤差に与える影響について検討する。実験では、ランダムに定義された拡張背景述語を様々な汎 用性レベルで導入し、家族関係領域における省略と実行の誤りに及ぼす影響を測定した。その結果、背景述語の一般性を高めると、コミッショニングエラーが急増し、それに伴い、オミッションエラーが急速に減少することが示された。今後は、背景述語と発明述語の一般性に基づいて選択するメタ解釈学習システムを研究する予定である。

メタ解釈学習(MIL)は、メタルールをインスタンス化して例から論理プログラムを学習するもので、Prologを用いたMetagolシステムで実装されています。本論文では、回答集合プログラミングを用いたMILの解法に関する過去の研究成果を基に、Prologが行うトップダウン探索を模擬して探索空間をより効果的に刈り込む、過去のMILエンコーディングの改良を述べる。最初の実験では、我々の新しいエンコーディングが帰納的学習プロセスを大幅に高速化できることが示された。

知識グラフは、ノードとエッジが注釈されたネットワークであり、ネットワークノード間のさまざまな関係を表現する。このようなグラフからの学習は、実世界の多くのシステムが知識グラフとして表現され、選択されたタイプのノードやエッジの特性を学習することができるため、ますます重要になってきている。本論文では、最先端のHINMINEネットワーク分解手法を発展させ、対象を絞った知識グラフ分解への完全自律的なアプローチを提示する。この手法では、選択されたノードタイプのノード間の重み付きエッジは、それぞれ異なるタイプの中間ノードを介して同じタイプの2つのノードを接続する、異なるタイプのトリプレットを介して構築される。このような分解の最終的な成果物は、選択されたノードタイプの重み付き同質ネットワークである。HINMINEは、教師ありネットワーク分解問題を組み合わせ最適化問題として再定式化し、微分進化のアプローチによって解くことで発展させたものである。提案手法は2つの現実の知識グラフのノード分類タスクでテストされる。実験結果は、提案するエンドツーエンド学習アプローチが、網羅的探索アプローチと同程度に高速かつ高精度であることを示している。

現在、産業界では、機器のメンテナンスコストやダウンタイムを最小限に抑えるために、ルールベースの診断システムが採用されています。ルールは通常、機器に取り付けられたセンサーからの信号を処理するために使用され、センサーによって記録されたタイムスタンプ付きの測定値のシーケンスをフィルタリング、集約、結合します。このようなルールは、個々のセンサーや機器の特性に依存するという意味で、データ依存型であることが多い。このような依存性は、特にルールにドメイン知識が必要な場合、エンジニアによるルール作成、再利用、保守に大きな課題となる。本研究では、このような問題を解決するために、オントロジーベースのデータアクセスアプローチに基づくアプローチを提案する。すなわち、センサ信号とルールを仲介するためにオントロジーを使用することを提案する。この目的のために、我々は信号が第一級市民であるセマンティックルール言語SDRLを提案する。この言語は表現力、使いやすさ、効率性のバランスがとれており、シーメンスのデータ駆動型診断ルールのほとんどを網羅し、診断タスクのオーサリングを大幅に簡素化する。また、オントロジーからデータへの意味的ルールの書き換えとデータ上での実行を効率的に行うことが可能である。我々は、このアプローチをセマンティック診断システムに実装し、評価した。評価のために、我々はシーメンス社の鉄道システムのユースケースを開発し、我々のソリューションのユーザビリティと効率の両方を実証するための実験を実施した。

産業工学の分野では、ソフトウェアツールのデータモデルが異種であるため、セマンティック・インターオペラビリティが課題として認識されている。本論文では、XMLベースのデータフォーマットAutomationML(AML)において、エンジニアリングオブジェクトの宣言的なクラス定義を学習する方法を示す。具体的には、AML文書を記述論理OWL 2 DLに変換し、DL-Learnerフレームワークを用いて、名前付きクラスの概念を学習する。さらに、AMLの構文仕様を利用してDL-LearnerのALC洗練オペレータを拡張し、大幅な学習性能の向上を示す。

Web of Dataは、ワールドワイドウェブ(WWW)インフラストラクチャを利用して、データソースを表現し、相互に関連付けている。これらのソースは知識グラフ(KG)と呼ばれ、RDFトリプルの形で事実の巨大なコレクションに相当する。KGに含まれるデータの分析は、いくつかの重要なKGキュレーションタスク、特にグラフの自動補完の前段階であり、WWWインフラのオープンで分散した環境のためにいくつかの課題を提起するものである。しかし、KGマイニングは、分析されるデータに関する有用なメタ情報、例えば、KGのスキーマが利用可能な場合には、それを利用することが可能である。本論文では、90年代に関係データベースから発見したいパターンのテンプレートとして提案されたメタクエリという概念に注目する。この概念をWeb of Dataの新しいコンテキストに拡張し、特にKGマイニングのケースに適用することを提案する。メタクエリ問題の特徴は、2階論理言語を使用することである。本論文では、2階記述論理に基づくが、Web of Dataの基盤となる標準的な技術で実装可能なメタクエリ言語を提示し、興味のあるコンテキストでこのようなメタクエリに答えるためのメカニズムについて簡単に説明する。キーワード メタクエリ – 知識グラフ – ルールマイニング.

知識グラフの表現学習は、実体と関係の両方を連続した低次元空間にベクトルとして射影することを目的としている。関係間のsubRelationOfという汎化関係によって構築される関係階層構造(RHS)は、知識表現学習の全体的な性能を向上させることができる。しかし、既存の手法の多くはこの重要な情報を無視しており、RHSを素直に考慮することは埋め込みに悪影響を及ぼし、結果としてモデル性能を低下させる可能性がある。本論文では、RHSを埋め込みにシームレスに取り込むことができるTransRHSと名付けた新しい手法を提案する。具体的には,TransRHSは各関係をベクトルとして,同じ空間内の関係固有の球とともに符号化する.TransRHSはベクトルと球の相対的な位置関係を用いて、関係間の固有の汎化関係を具現化するsubRelationOfをモデル化する。本モデルをリンク予測、トリプル分類という2つの典型的なタスクで評価した。この結果は、RHSの情報が知識グラフの表現学習にとって重要であり、TransRHSはRHSを知識グラフの埋め込みに効果的かつ効率的に融合できることを証明するものである。

我々は、説明生成システムLIMEの適応を提案する。LIMEは疎な線形モデルに依存しているが、我々はより豊かな説明を生成する方法を模索する。応用領域として、我々は古代の墓の粗い表現からなる画像を用いる。墓は2つのクラスに分けられ、意味のある特徴と関係によって特徴付けることができる。この領域は、心理学で研究されている古典的な概念獲得領域と類似して生成された。LIMEと同様に、我々のアプローチは説明されるべきインスタンスの簡略化された表現の周りにサンプルを描画する。サンプルはジェネレータによってラベル付けされ、画像で訓練されたブラックボックス分類器をシミュレートする。LIMEとは対照的に、我々はこの情報をILPシステムであるAlephに供給する。また、Alephの評価関数をカスタマイズして、インスタンスの類似性を考慮するようにした。我々は、この手法を古代の墓のドメインの異なるバリエーションに対する説明を生成するために適用した。その結果、疎な線形モデルの表現力を超えて、より豊かな知識を含む説明を生成できることを示した。

多くの人は、4年ごとにうるう年が来ると思っている。しかし、この法則はあまりにも一般的で、Xが400で割り切れる場合を除き、100で割り切れる場合を除き、Xが4で割り切れる場合はうるう年である。このような一般化と特殊化が交互に繰り返される理論を段階的狭義理論と呼ぶ。我々は、このような理論の学習を容易にするILPシステムMetagolの拡張を発表し、評価した。Metagolは、学習中の偽陽性の数を制限することにより、過剰汎化理論の学習を可能にした。この拡張は、学習課題に対して繰り返し適用される。最初の反復の後、各反復において、正例は前の反復の偽陽性であり、負例は前の反復の真陽性である。反復は偽陽性が無くなるまで続けられる。その後、各理論を結合し、1つの段階的な絞り込み理論にする。我々は、閏年の領域で本アプローチの有用性を評価した。その結果、我々のアプローチは、より少ない節数で、より高い精度で、より短い時間で解を見つけることができることを示すことができる。

本論文では、与えられたILP問題のすべての解を効率的に列挙する方法を提案する。帰納論理プログラミング(ILP)は、全てのデータ、背景知識、仮説が一階論理で表現できることを前提とした機械学習の手法である。ILP問題の解は仮説と呼ばれる。ILPの研究の多くは、1つの問題に対して1つの仮説しか見つけられない方法を提案している。これに対し、提案手法は二項決定図(BDD)を用いて、与えられたILP問題の全ての仮説を列挙する。BDDはブール関数の非常にコンパクトなグラフ表現である。すべての仮説が列挙されると、ユーザは好ましい仮説を選択するか、評価関数を用いて仮説を比較することができる。我々は、全仮説の集合を表すBDDを構築するための効率的な再帰的アルゴリズムを提案する。また、評価関数が与えられた場合に、最適な仮説を得るための効率的な方法を提案する。実データを用いたILP問題において、本アプローチの実用性を実証的に示す。

ILP学習器は、テストされた仮説ごとに各訓練例を順次検討するように実装されるのが一般的である。この方法で仮説のカバーセットを計算するのはコストがかかり、学習プロセスにおける大きなボトルネックとなる。この計算は、データレベルの並列性を利用することで、より効率的に実装することができる。ここでは、命題論理と一階論理のサブセットに対して、このタスクをGPUで高速化するアプローチを提案する。このアプローチは、仮説空間の探索のために選択した戦略とともに使用することができる。現在、仮説言語は、ある種の記述論理がカバーするような、単項述語と二項述語を用いた論理式に限定されている。本アプローチは、コモディティGPUと最大2億の学習例からなるデータセットでテストされ、カバーセット計算あたり30ms以下の実行時間を達成しました。

本論文では、3次テンソルを用いて、abductive Horn命題の解を計算するアルゴリズムを提案する。まず、説明演算子という概念を導入し、反転含意に基づく一段階の演算を行い、この演算子を用いて与えられたホーン命題の最小限の漸近解が正しく計算できることを証明する。次に、ホーン命題プログラムの3次テンソルへのマッピングを提供する。これは、ホーンプログラムの行列表現に関する最近の研究を基礎とするものである。最後に、このマッピングを用いて、テンソルの乗算によって説明演算子を計算する方法を示す。

解釈遷移からの学習(LFIT)は、システムの状態遷移の観測から、システムのダイナミクスのモデルを自動的に構築するものである。これまでのところ、LFITが扱うシステムは、同期的な決定論的ダイナミクス、すなわち、すべての変数が同時に値を更新し、システムの各状態に対して、次の状態の可能性が1つだけ存在するものに限定されています。しかし、論理モデリングの分野では他のダイナミクスも存在し、特に生物系のモデリングに広く用いられている非同期的セマンティクスがある。本論文では、システムのセマンティクスに依存しないダイナミクスを学習する手法に着目する。そのために、多値システムを論理プログラムとしてモデル化し、ルールが「何が起こるか」ではなく「何が起こりうるか」を表現することを提案する。このモデル化により、非決定性を表現することができ、更新方式に関わらず、離散的な多値遷移から学習するためのセマンティクスフリーアルゴリズムという形でLFITの拡張を提案する。理論的な結果を通じて、同期、非同期、一般セマンティクスの全てがこの手法によって捕捉されることを示す。また、ランダムに生成されたシステムと生物学の文献にあるベンチマークを用いて実用的な評価を行い、前述の3つのセマンティクスに関する本新規アルゴリズムのスケーラビリティを研究する。

状態遷移の観測からシステムダイナミクスを学習することは、バイオインフォマティクスにおいて多くの応用があります。遺伝子の相互影響の特定に対応し、その相互作用を理解することができる。解釈遷移からの学習(LFIT)のような方法を用いることで、時系列データからモデルを自動的に学習することができる。この方法は、システムの全ての遷移を入力とした場合、厳密なモデルを学習する。しかし、実際の生物データでは、そのような完全なデータセットにアクセスできないのが普通であり、部分観測でシステムを学習する必要がある。通常、生物学者はシステムのダイナミクスに関する先験的な知識を、時間的特性という形で提供している。モデルを構築する際、重要な特性を有効に保つことは大きな関心事の一つであり、モデル検査はそのような望ましい特性の検証の役割を果たす。本研究では、時間的性質を利用して論理プログラムを修正するためのモデル検査手法を提供することを目的とする。本論文では、その第一歩として、到達可能性特性を利用して、このようなモデルに適合させる方法を提案する。

我々は、データ交換のためのスキーママッピングの発見というタスクをILP問題として捉え、その結果生じる課題と利点を議論する。課題は、簡単な例で説明するように、複雑なマッピングを実際に学習する必要性から生じている。

次回はILP2019について述べる。

コメント

  1. […] Inductive logic Programming 2018論文集より […]

  2. […] 次回はILP2018について述べる。 […]

タイトルとURLをコピーしました