Inductive logic Programming 2016論文集より

機械学習技術人工知能技術自然言語処理技術セマンティックウェブ技術オントロジー技術デジタルトランスフォーメーション技術 AI学会論文知識情報処理技術推論技術本ブログのナビ

ILP 2016 26th International Conference Inductive Logic Programming

前回は、ILP2012について述べている。今回は、第26回帰納論理プログラミング国際会議（ILP 2016）について述べている。ILP 2016は、2016年9月4日から6日の間、ロンドンのWarren House Conference Centreで開催された。1991年の第1回以来、毎年開催されるILPカンファレンスは、構造化された関係データからの学習に関する第一級の国際フォーラムとして機能してきた。当初は論理プログラムの帰納に焦点を当てていたが、長年にわたり研究の視野を大きく広げ、論理における学習、多関係データマイニング、統計的関係学習、グラフと木のマイニング、他の（非命題）論理ベースの知識表現の枠組みにおける学習、統計学習との交差の探求、他の確率的アプローチなどのあらゆる側面に関する貢献している。これらの分野での理論的な進歩は、バイオインフォマティクス、医学、テキストマイニングなどの分野における重要な問題へのこれらの技術の挑戦的な応用も伴っている。

今回の会議では、過去の開催に引き続き、3種類の投稿を募集している。(a) 適切な実験的評価や自己充足的な理論的貢献を伴う成熟したオリジナルな研究を記述したlong paper、(b) 進行中のオリジナルな研究、決定的な評価のないオリジナルのアイデアの簡潔な説明、その他の科学的関心が高いがlong paperに分類されない関連研究を記述したshort paperの3種類の論文を募集している。最後に、(c) 会議のテーマに関連し、ECML/PKDD、ICML、KDD、ICDM、AAAI、IJCAIなどの一流学会や、MLJ、DMKD、JMLRなどの雑誌に最近発表または掲載が認められた論文となる。

この会議では、10編の長編論文、19編の短編論文、6編の掲載論文の合計35編の投稿があった。投稿されたlong paperとshort paperは、それぞれ3名のプログラム委員（PC）により審査された。長編論文10本のうち、4本が発表および掲載のために採択された。ショートペーパーは、提出された原稿と発表内容でまず評価され、これらの論文の一部の著者には、拡張版の提出が求められた。その後、2回目の審査を経て、最終的に6本の論文が採用された。つまり、4本の長編論文と合わせて、10本の論文が本書に収録されることが決まった。

ILP 2016のプログラムには、5つの大規模なテクニカルセッションが含まれていた。論理と学習、グラフとデータベース、確率的論理と学習、アルゴリズム、最適化、実装、アプリケーションです。述語発明、グラフ学習、空間学習、論理的基礎、統計的関係学習、確率的ILP、実装とスケーラビリティ、ロボット工学、サイバーセキュリティ、ゲームにおける応用など、ILP研究の現在の広がりをよく表しており、理論研究と実践研究のバランスも優れている。ILP 2016は、Machine Learning誌から最優秀学生論文賞の寛大なスポンサーシップを受けた。ILP 2016の最優秀学生論文賞は、Yisong Wang、Ying Zhang、Mingyi Zhangとの共著「Learning Disjunctive Logic Programs from Interpretation Transition」と題する論文でYi Huang、論文「Inductive Logic Programming Meets Relational Databases」でMarcin Malecに贈られた2名。Tushar Khot、James Nagy、Erik Blasch、Sriraam Natarajanとの共著「Inductive Logic Programming Meets Relational Databases: An Application to Statistical Relational Learning」に対してとなる。また、この会議では、Springer社からベストペーパー賞のスポンサーシップを受けた。この賞は、Ashwin Srinivasan、Gautam Shroff、Lovekesh Vig、Sarmimala Saikiaによる論文「Generation of Near-Optimal Solutions Using ILP-Guided Sampling」に対して贈られた。

また、産学連携や議論の活性化を目的に、産学の著名な研究者による3つの招待講演も行われた。マサチューセッツ大学のDavid Jensen氏は、「Inferring Causal Models of Complex Relational and Dynamic Systems」と題し、因果推論に関する重要なアイデア、表現、アルゴリズムについて紹介し、新たな技術的フロンティアを強調した。オックスフォード大学のFrank Wood氏は、”Revolutionising Decision Making, Democratising Data Science, and Automating Machine Learning via Probabilistic Programming “と題する講演を行った。講演では、プログラミング（モデリング）言語と自動推論の両方の観点から、確率的プログラミングという新しい分野を広く俯瞰し、この分野が直面している最も重要な課題を紹介した。最後に、IBM T.J. Watson Research CenterのCognitive Computing Research部門の上級研究員であるVijay Saraswat氏は、講演「Machine Learning and Logic」の中で、以下のように述べた。The Beginnings of a New Computer Science?” と題し、コンプライアンスに対応した認知アシスタントを構築する上で、自然言語処理、機械学習、知識表現・推論分野の研究者を結集して取り組むべきオープンな課題について述べた。

この会議では、組織委員会のメンバーであるMark Lawが企画・運営する国際コンペティションが初めて開催されました。このコンペティションは、応募された学習システムの精度、スケーラビリティ、汎用性をテストすることを目的としている。コンペティションは、確率的アプローチと非確率的アプローチの2つのメイントラックで行われた。受賞者は、マルマラ大学のPeter Schüller氏の非確率論的アプローチと、Riccardo Zese氏、Elena Bellodi氏、Fabrizio Riguzzi氏の確率論的アプローチの3名による共同受賞です。コンペの結果は、http://ilp16.doc.ic.ac.uk/ competition で公開されている。

以下内容について述べる。

Estimation-Based Search Space Traversal in PILP Environments

確率的帰納論理プログラミング(PILP)は、世界を確率的な事実と規則で表現し、予測に利用できる確率的な理論を学習することで、ILPを拡張するシステムである。しかし、このようなシステムでは、ILPアルゴリズムから引き継いだ大きな探索空間と、新しい理論候補を生成するたびに必要となる確率的評価のために、非効率的である可能性がある。そこで、本研究では、PILPシステムの効率化を目的とした確率推定器を導入する。推定器は、2つの部分理論の組み合わせの値の推定値を提供することにより、確率的理論評価の計算コストを回避することができる。異なる分野の3つの実データセット（生物学、医学、ウェブベース）を用いて実験を行い、評価すべき理論の数を減らすことで、確率的な精度を損なうことなく推定器の実行時間を大幅に短縮できることを示す。

Inductive Logic Programming Meets Relational Databases: Efficient Learning of Markov Logic Networks

統計的関係学習(SRL)は、確率論と一階論理を組み合わせることにより、ノイズの多い関係データの存在下で学習するために開発されたアプローチである。しかし、これらのモデルの学習手法は、大規模なデータセットに対応できない。関係データベースをSRLで利用する研究は進んでいるが[14]、複雑なモデルの学習（構造学習タスク）を扱うための拡張はなされていない。我々は、関係データベースの利点と帰納論理プログラミングの豊富な帰納的バイアスを用いた検索戦略を組み合わせたスケーラブルな構造学習アプローチを提示する。本アプローチはマルコフ論理回路網のブースト構造学習において、その有効性を実証的に示している。

Online Structure Learning for Traffic Management

センサー環境におけるイベント認識手法の多くは、イベントを検出するために手動で構築したパターンに基づいており、不確実性が存在する場合に関係構造を学習する能力に欠けている。本論文では、イベント計算の公理化を利用したマルコフ論理回路網のオンライン構造学習器OSLαを、交通管理のためのイベント認識に応用することを述べる。我々は、大量の実センサデータと、専門的な交通マイクロシミュレータによって生成された合成データに基づいて、実証的な評価を行う。その結果、OSLαは交通渋滞の定義を効果的に学習し、場合によっては人間の専門家が構築したルールを上回る性能を発揮することが実証された。

Learning Through Advice-Seeking via Transfer

専門家は、標準的な機械学習手法では通常無視される膨大な知識を持っている。この豊富で関係性のある知識を利用することで、特にノイズの多い不完全な学習データが存在する場合でも、よりロバストなモデルを学習することができる。このような専門家はドメインの専門家であることが多いが、機械学習の専門家ではないことが多い。そのため、どのような知識を提供すべきかを決定することは難しい問題である。我々の目標は、機械が生成したバイアスを専門家に提供することで、人間と機械の相互作用を向上させることであり、必要に応じて専門家が改良することができる。そのために、我々は、専門家が有用な助言を行えるように導くために、代替領域における知識を活用した”転移学習の概要とアルゴリズムおよび実装例について“でも述べている転移学習を用いることを提案する。この知識は、一階論理のホーン節の形で捕捉される。我々は、移譲された知識の価値と、専門家が最初の知識を提供し、さらに移譲された知識の使用を修正し指示することに貢献することを経験的に実証する。

How Does Predicate Invention Affect Human Comprehensibility?

1980年代、Michieは機械学習を、予測精度と生成された仮説の理解度という直交する2つの性能軸で定義した。予測精度は容易に測定可能であるが、理解度はそうではないため、1990年代のMitchellの定義などでは、予測精度のみに基づく一次元的な機械学習のアプローチを用いる傾向があり、最終的には、記号的機械学習アプローチよりも統計的機械学習アプローチが好まれることになった。本論文では、人間による試行を用いて推定可能な仮説の理解可能性の定義を示す。また、述語発明を用いた場合と用いない場合の論理プログラムの理解可能性を検証する実験の結果を示す。その結果、理解可能性は提示されたプログラムの複雑さだけでなく、匿名の述語記号の存在にも影響されることが示された。
Distributional Learning of Regular Formal Graph System of Bounded Degree

本論文では、分布学習の手法を形式グラフシステム（FGS）言語に適用する方法について述べる。FGSとは、一階述語論理の項の代わりに項グラフを扱う論理プログラムである。我々は、1-finite context property (1-FCP)とbounded treewidth propertyを持つ有界次数の正規FGS言語が、正データとメンバーシップクエリーから学習可能であることを示す。
Learning Relational Dependency Networks for Relation Extraction

我々は、KBPスロットフィリングのタスク、すなわち、知識ベース構築のためにニュースワイヤー文書から関係情報を抽出することを考える。本論文では、関係依存ネットワーク(RDN)を用いて関係抽出のための言語パターンを学習する我々のパイプラインを紹介する。さらに、弱い監視、word2vec特徴、共同学習、人間の助言の利用など、いくつかの要素をこの関係フレームワークにどのように組み込むことができるかを実証する。ベンチマークであるKBP 2015タスクで異なるコンポーネントを評価し、RDNが多様な特徴のセットを効果的にモデル化し、現在の最新鋭の関係抽出手法と競争力のあるパフォーマンスを発揮することを示す。
Towards Nonmonotonic Relational Learning from Knowledge Graphs

近年の情報抽出の進歩により、知識グラフ（KG）と呼ばれる、関係する事実知識の巨大な集合体が生み出されている。知識グラフは自動的に構築されるため、本質的に不完全であり、オープンワールド仮定(OWA)の下で自然に扱われる。ルールマイニングの技術は、KGの完成という重要なタスクをサポートするために利用されてきた。しかし、これらの技術はホーンルールをマイニングすることができ、例外を捉えるには表現力が不十分であり、その結果、ミッシングリンクについて誤った予測をする可能性がある。最近、このギャップを埋めるルールベースの手法が提案されたが、これは単項のファクトのみを持つKGの平坦化された表現に適用される。本研究では、この手法を元の関係型のKGに拡張するための第一歩を踏み出し、実世界のKGに対する予備的な評価結果を提供し、本手法の有効性を実証する。
Learning Predictive Categories Using Lifted Relational Neural Networks

“Lifted Relational Neural Networks (LRNN)の概要とアルゴリズム及び実装例“で述べているLRNN（Lifted Relational Neural Network）は、リフテッド・モデリングの考え方に基づく柔軟なニューラル・シンボリックのフレームワークである。本論文では、LRNNが、潜在的な実体、性質、関係のカテゴリを共同で誘導する必要がある学習問題を宣言的に指定し解決するために、どのように簡単に使用できるかを示す。
Generation of Near-Optimal Solutions Using ILP-Guided Sampling

この論文では、直接的な数値最適化では解けないが、関連する領域固有の知識が大量に存在する最適化問題に関心をもっている。分布推定アルゴリズム（EDA）として知られる”ヒューリスティック探索（Hill Climbing、Greedy Searchなど）ベースの構造学習について“でも述べているヒューリスティック探索技術のカテゴリは、最適（または最適に近い）解が次第に高い確率を持つ確率分布から漸進的にサンプリングすることを目的としている。このような分布の推定を支援するために領域知識を利用することは可能であろうか。これを肯定的に答えるには、以下のものが必要である。(a)最適値のモデルを構築する際に領域知識を取り入れる汎用的な手法、(b)そのモデルを用いて新しいデータ標本を生成する方法。ここでは、(a)については帰納論理プログラミング(ILP)を用い、(b)については通常の論理型プログラミング装置を用いて新しいサンプルを生成する方法を検討する。具体的には、分布推定の各反復において、ILPエンジンを用いて良質の解を求めるモデルを構築する。その結果得られた理論は、新しいデータインスタンスの生成を導くために使用され、そのデータインスタンスは、ILPモデルと背景知識との組み合わせで導出可能なものに限定される。）我々は、2つの最適化問題（KRKの終盤戦における最適勝利深度の予測、および、ジョブショップのスケジューリング）において、このアプローチを実証した。その結果、有望な結果が得られた。(a)分布推定の各反復において、ILP理論を用いて得られたサンプルは、理論を用いないサンプルよりも良い解の割合が大幅に増加する。(b)分布推定の終了において、ILP理論を用いて得られたサンプルは、理論を用いないサンプルよりも最適に近いサンプルをより多く含む。これらの結果を総合すると、ILP理論の利用は、複雑な領域知識を推定分布手順に取り込むための有用な手法となり得ることが示唆される。

次回はILP2017について述べる。

Deux Ex Machina

AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。

Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.