機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術 知識情報処理技術 AI学会論文を集めて 推論技術
前回はILP2016について述べた。今回は、2017年9月にフランスのオルレアンで開催された第27回帰納論理プログラミング国際会議ILP2017について述べる。
発表された12のフルペーパーは、多数の投稿の中から慎重に審査され、選ばれたものである。
帰納論理プログラミング(ILP)は機械学習のサブフィールドであり、もともと例、背景知識、仮説を表現するための統一的な表現言語として論理プログラミングに依存しています。ILPは、一階論理に基づく強力な表現形式により、多段階学習やデータマイニング、さらに一般的には構造化データからの学習のための優れた手段を提供する。
内容としては、ロボット制御、知識ベースと医療、画像認識における統計的機械学習、関係学習、ロジックベースのイベント認識システム、リレーショナルデータからボルツマンマシン分類器を学習する問題、並列帰納論理プログラミング、解釈遷移(LFIT)からの学習、Lifted Relational Neural Networks (LRNN) 、WOrd2Vecの改善について述べる。以下に詳細について述べる。
ロボットの握るは、特定の操作シナリオ(オブジェクト、そのプロパティ、タスク、および握る制約)によって異なります。オブジェクトタスクのアフォーダンスは、意図されたタスクに関する事前把握構成に関する意味論的推論を容易にし、適切な把握を促進します。確率的ルール学習を使用して、現実的なビデオデータからタスク依存の把握のためにそのようなオブジェクトタスクアフォーダンスを回復します。
知識ベースの完成や患者の自動診断などの多くのアプリケーションは、肯定的な例にしかアクセスできませんが、標準的な関係学習手法で必要とされ、閉世界仮説の下で苦しむ否定的な例はありません。対応する命題問題は、ポジティブおよびラベルなし(PU)学習として知られています。この分野では、ラベル頻度(ラベル付けされた真陽性の例の割合)を使用すると学習が容易になることが知られています。この概念は、リレーショナルドメインではまだ検討されていません。この作業の目的は2つあります。(1)リレーショナルデータを操作するときにラベル頻度を使用することも役立つかどうかを調査することと、(2)リレーショナルポジティブデータとラベルなしデータからラベル頻度を推定する方法を提案することです。
医療データは、異なるエンティティ間に存在する複雑な相互作用のため、リレーショナルデータマイニングの対象として特に興味深いものです。さらに、医用画像のあいまいさにより、解釈が複雑になり、エラーが発生しやすくなります。したがって、自動化された意思決定サポートによる改善が特に容易になります。確率的誘導論理プログラミング(PILP)は、この分野の関係性と医用画像の人間による解釈に固有のあいまいさを組み合わせることができるため、このタスクに特に適したツールです。この作業は、乳がんデータのPILP設定を示します。ここでは、いくつかの臨床変数と人口統計変数が遡及的に収集され、ドメイン知識を反映する新しい確率変数とルールが導入されました。
統計的機械学習は、画像分類で広く使用されています。ただし、ほとんどの手法は、(1)高精度を実現するために多くの画像を必要とし、(2)分類レベル未満の推論をサポートしていないため、光源の存在や位置などの二次的な推論をサポートできません。画像の外側のオブジェクト。最近の研究では、論理ビジョン(LV)と呼ばれる帰納論理プログラミングアプローチがこれらの制限のいくつかを克服することが示されました。LVは、画像からサンプリングされた高コントラストポイントの低レベル抽出と組み合わせたメタ解釈学習を使用して、画像を記述する再帰的論理プログラムを学習します。この論文は、(a)生の画像からの二次推論を可能にするより豊富な背景知識を使用してLVを拡張します。統計的アプローチでは簡単にモデル化できない視覚的な曖昧さを解決するためにそれ自体を学習して使用できる光反射など、(b)円や楕円などの古典的な2D形状を表す幅広いクラスの背景モデル、(c)プリミティブレベル実際の画像のノイズを処理するための統計的推定量。私たちの結果は、LVの新しいノイズロバストバージョンが、人間の科学的発見プロセスと非常によく似た、データがほとんどない実際の画像の二次推論タスクを処理できることを示しています。具体的には、単一の例(つまり、ワンショットLV)を使用して、隠れた光源の予測に関して少なくとも30ショットの統計的機械学習者に匹敵する精度に収束します。
ディープラーニングアプローチによって学習された潜在機能は、機械学習の強力なツールであることが証明されています。これらは、データの規則性を明示的にキャプチャすることで学習を容易にするデータ抽象化として機能します。彼らの利益は、関係学習の文脈への適応を動機づけました。以前の作業では、インスタンスとその関係をクラスタリングすることにより、関係潜在機能を学習するアプローチを紹介します。潜在表現の主な欠点は、それらがしばしばブラックボックスであるということです解釈が難しい。この作業はこれらの問題に対処し、(1)クラスタリングによって作成された潜在的な機能が解釈可能であり、データの興味深いプロパティをキャプチャすることを示しています。(2)ラベルとよく一致するインスタンスのローカル領域を識別します。これは、それらの利点を部分的に説明しています。(3)このアプローチによって生成される潜在的な特徴の数は多いですが、多くの場合、それらの多くは非常に冗長であり、パフォーマンスをそれほど損なうことなく削除できます。
ロジックベースのイベント認識システムは、一次ルールの形式の一連のイベント定義を使用して、時間内にイベントの発生を推測します。イベント計算は、イベント認識アプリケーションの基礎として使用されてきた時相論理であり、とりわけ、帰納論理プログラミング(ILP)を介して機械学習への直接接続を提供します。OLEDは、最近提案されたILPシステムであり、データストリームを1回通過するだけで、イベント計算理論の形式でイベント定義を学習します。この作品では、並列のオンライン学習を可能にするバージョンのOLEDを紹介します。ベンチマーク活動認識データセットでアプローチを評価し、場合によっては超線形のスピードアップを達成しながら、トレーニング時間を短縮できることを示します。
リレーショナルデータからボルツマンマシン分類器を学習する問題を検討します。私たちの目標は、RBMの深い信念のフレームワークを統計的リレーショナルモデルに拡張することです。これにより、統計的関係学習(SRL)で使用される豊富な表現よりも、RBMに固有の機能階層と非線形性を活用できます。具体的には、リフトされたランダムウォークを使用して述語の特徴を生成し、マルコフ論理ネットワークと同様の方法でRBMで観測された特徴を構築するために使用されます。RBMを構築するこの方法は、6つのリレーショナルドメインでの最先端の確率的リレーショナル学習アルゴリズムに匹敵するか、それよりも優れていることを経験的に示します。
この研究では、並列帰納論理プログラミング(ILP)システムを改善して、超線形高速化を可能にします。この改善により、ILP学習システムとパラレルメカニズムのいくつかの機能が再設計されます。再設計されたILP学習システムは、同じ評価を持つすべてのルールを検索して収集します。再設計されたパラレルメカニズムは、識別されたルールの評価を共有するための通信プロトコルを追加し、それによって超線形の高速化を実現します。
解釈遷移(LFIT)から学習すると、状態遷移の観察からシステムのダイナミクスのモデルが自動的に構築されます。これまでのところ、LFITが処理するシステムは離散変数に制限されているか、連続データの離散化を想定しています。ただし、実際のデータを操作する場合、 LFITによって学習されるモデルの品質には、離散化の選択が重要です。この論文では、連続時系列データからシステムのダイナミクスを直接学習する方法に焦点を当てます。この目的のために、条件と結論が値の連続性を表すルールで構成される論理プログラムによる連続ダイナミクスのモデリングを提案します。
Lifted Relational Neural Networks (LRNN) は、フィードフォワードニューラルネットワークを構築するためのテンプレートとして機能する重み付き一次規則を用いて関係領域を記述します。これまでの研究で、LRNNを用いることで様々なILPタスクにおいて最先端の結果が得られることが示されてきたが、これらの結果は手作業で作成されたルールに依存していた。本論文では、LRNNの枠組みを構造学習によって拡張し、完全な自動学習プロセスを可能にする。多くのILP手法と同様に、我々の構造学習アルゴリズムは、可能な全てのホーン節の仮説空間をトップダウンで探索し、学習例で出現する述語と、これまでに見つかった最適な重み付きルールが内包する柔らかい概念を考慮しながら反復的に学習を進める。実験では、有用な階層的なソフトコンセプトが自動的に生成され、競争力のある予測能力を持つディープLRNNにつながることを実証した。
帰納論理プログラミングのコンテキストで仮説空間を剪定する方法を提示します。私たちの方法の主な戦略は、すでに考えられている仮説と同等の仮説を削除することです。私たちの方法の際立った特徴は、同型仮説のみを取り除く既存のアプローチとは対照的に、学習した領域理論を使用して等価性をチェックすることです。具体的には、このような学習した領域理論を使用して仮説を飽和させ、これらの飽和が同型であるかどうかを確認します。概念的には単純ですが、結果として得られるプルーニング戦略は、同型のみを考慮するアプローチと比較して、長い句を検索する際の計算時間とメモリ消費の両方を驚くほど効果的に削減できることを実験的に示しています。
高次元ベクトル空間での類似性の計算は長年の問題であり、最近、ワード2vecの発明で大きな進歩が見られました。アルゴリズム。通常、埋め込み表現を使用すると、対処するタスクのパフォーマンスが大幅に向上することがわかっています。埋め込みが帰納論理プログラミング(ILP)で検討されている種類のデータで同様にパフォーマンスを向上させることができるかどうかは不明です。このデータでは、表面上は明らかに異なるデータが、ドメイン(バックグラウンド)の知識があれば互いに類似している可能性があります。このホワイトペーパーでは、いくつかのILP分類ベンチマークを使用して、十分な量の背景知識がある問題に対して、埋め込み表現が同様に役立つかどうかを調査します。利用可能な背景知識の関連性について専門知識を持っているタスクを使用し、背景述語の2つのサブセット(「十分」と「不十分」)を検討します。サブセットごとに、ブール値のリレーショナル機能で構成されるベースライン表現を取得します。次に、分類用に特別に設計されたベクトル埋め込みが取得されます。最後に、埋め込み表現がある場合とない場合で広く使用されている分類方法の予測パフォーマンスを調べます。十分な背景知識があれば、埋め込み表現によるパフォーマンスの向上を示す統計的証拠は見つかりません。十分な背景知識がないため、私たちの結果は、深いネットワークを使用する特定のケースでは、埋め込み表現が役立つ可能性があるという経験的証拠を提供します。十分な背景知識があれば、埋め込み表現によるパフォーマンスの向上を示す統計的証拠は見つかりません。十分な背景知識がないため、私たちの結果は、深いネットワークを使用する特定のケースでは、埋め込み表現が役立つ可能性があるという経験的証拠を提供します。十分な背景知識があれば、埋め込み表現によるパフォーマンスの向上を示す統計的証拠は見つかりません。十分な背景知識がないため、私たちの結果は、深いネットワークを使用する特定のケースでは、埋め込み表現が役立つ可能性があるという経験的証拠を提供します。
次回はILP2018について述べる。
コメント
[…] Inductive logic Programming 2017論文集より […]
[…] 次回はILP2017について述べる。 […]