Reasoning Web2018論文集より

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術   AI学会論文    知識情報処理技術   AI学会論文を集めて     推論技術

前回はReasoning Web2017について述べた。今回は2018年9月にルクセンブルグEsch-sur-Alzetteで開催された第14回Reasoning Webについて述べる。

具体的な内容としては、規範推論、テキストコーパスと知識ベースを組み合わせた効率的な検索に関するクイックサーベイ、大規模な確率論的知識ベース、条件付き確率場(Conditional Random Fields)を知識ベースの生成タスクに適用する方法、DBpediaやWikidataのような大規模なクロスドメイン知識グラフ、大規模な知識グラフ(KG)の自動的な構築と知識グラフからルールの学習、巨大なRDFグラフの処理、Web環境でのストリーム処理アプリケーションの開発、非常に大規模な知識ベースに対する推論について述べる。

以下詳細な内容について述べる。

規範推論を実現するための規範の形式的表現に関するいくつかの本質的な問題について議論し、それらの要求を計算指向の形式主義である Defeasible Deontic Logic で捉える方法を示し、この論理の記述を提供し、法的な例を用いて規範のモデル化と推論のための使用法を説明する。

本論文は、テキストコーパスと知識ベースを組み合わせた効率的な検索に関するクイックサーベイである。このようなデータを効率的に検索するための2つのシステムの高レベルな説明を提供する。最初の、そして古いシステムであるBroccoliは、基礎となるデータに関する専門的な知識がなくても使える、非常に便利なUIを提供します。しかし、その代償として、検索言語が制限されています。2番目の新しいシステムであるQLeverは、SPARQLをテキスト検索に拡張したSPARQL+Textのための効率的なクエリエンジンを提供します。展望として、QLeverのパワーとBroccoliの利便性を兼ね備えたシステムをどのように提供するかという問題を議論する。Broccoli、QLeverともに、知識ベースを検索するだけの場合にも有効である

大規模な確率論的知識ベースは、学術的にも産業的にもますます重要性を増している。知識ベースは常に新しいデータで拡張され、知識ベースのファクトに確率を関連付ける最新の情報抽出ツールによって支えられています。このチュートリアルは、確率的知識ベースの可能性を最大限に活用するために使用することができる様々なクエリ応答と推論タスクの理解を深めることを目的としています。チュートリアルの最初のパートでは、最も単純な確率的データモデルである(タプルに依存しない)確率的データベースに焦点を当てます。チュートリアルの第2部では、確率データベースをオントロジー知識で拡張した、よりリッチな表現に移行する。それぞれのパートでは、既知のデータ複雑性の結果をレビューし、また、最近の結果について議論します。

このチュートリアルでは、条件付き確率場(Conditional Random Fields)を知識ベースの生成タスクに適用する方法について説明します。我々は、特に、興味のあるドメインに関連するクラスとプロパティをモデル化するオントロジーと、構造化されていないテキストから入力される必要がある空の知識ベースを想定したコールドスタートの設定に興味があります。より具体的には、コールドスタートによる知識ベース生成は、オントロジーで定義されたクラスとプロパティをインスタンス化した意味構造を入力文書から予測することからなる。知識ベース生成は構造予測であると考え、入力文書からオントロジーに基づく出力変数の集合への最も可能性の高い割り当てを予測することを目的とした統計的推論問題として捉える。テキストから得られる入力変数が与えられたときのこれらの出力変数の条件付き分布をモデル化するために、我々は条件付きランダムフィールドで採用されたアプローチに従う。コールドスタート知識ベース生成タスクを、固有表現認識、固有表現連結、スロットフィリングの各問題に分解し、それらが条件付き確率場を用いてどのようにモデル化されるかを示す。

DBpediaやWikidataのような大規模なクロスドメイン知識グラフは、セマンティックウェブのデータセットとして最も人気があり、広く利用されているものである。本論文では、セマンティックウェブで最も人気のある知識グラフをいくつか紹介する。また、これらの知識グラフを改良するために機械学習がどのように利用されているか、さらに、推薦システムなどの一般的な機械学習タスクの背景知識としてどのように利用できるかを論じる。

情報抽出の進歩により、DBpedia、Freebase、YAGO、Wikidataなどの大規模な知識グラフ(KG)を自動的に構築することが可能になった。知識グラフからルールを学習することは、知識グラフの補完、クリーニング、キュレーションに不可欠なタスクである。このチュートリアルでは、最新のルール誘導法、最近の進歩、研究の機会、そしてこの道における未解決の課題を紹介します。特に、偏りのある不完全なデータから、例外を考慮したルールを学習する問題に重点を置く。最後に、構造化されたリソースだけでなく、非構造化リソース(例えば、テキスト)を考慮するための古典的なルール誘導技術の拡張の可能性について議論する。

近年、何兆ものトリプルを持つ巨大なRDFグラフが作成されるようになった。この膨大なデータを処理するために、グラフデータを計算ノードとストレージノードに分散させ、クエリ処理とメモリ需要のスケーリングを行うスケーラブルRDFストアが使用されています。このようなクラウド上のRDFストアを開発するために調査すべき主な課題は以下の通りです。(i)計算ノードとストレージノードへのデータ配置戦略、(ii)分散クエリ処理戦略、(iii)計算ノードとストレージノードの障害対応戦略である。本原稿では、クラウド上のスケーラブルなRDFストアがこれらの課題にどのように対処しているかを概観する。

このチュートリアルの目的は、Web環境でストリーム処理アプリケーションを開発し、再現可能な方法で配備する方法の概要を説明することです。

そのために、以下のことを意図しています。

  1. 高度に動的なデータに対する問い合わせや推論で発生するストリーム推論/RDFストリーム処理の既存の研究成果を調査する。
  2. 現代のWebに見られるような、多様性と速度の両方を特徴とするデータ中心の問題に取り組む際に使用する強力なツールとしてのストリーム推論技術を紹介する。
  3. データの速度と多様性を同時に扱う必要があるWeb中心のユースケースを提示する。
  4. Webストリーム処理アプリケーションの開発を通して、参加者を指導します。

このチュートリアルでは、非常に大規模な知識ベースに対する推論を実行する ための現在の方法の概要を説明する。講義の最初の部分は、問題と関連技術の紹介に費やされる。次に、現在のアプローチの長所と短所に特に重点を置きながら、非常に大きな入力に対する推論のための最先端技術を議論し続ける。最後に、この分野における最も重要な研究の方向性について概説し、このチュートリアルを終了する。

次回はReasoning Web2019について述べる。

コメント

  1. […] 次回はReasoning Web2018について述べる。 […]

タイトルとURLをコピーしました