知識表現と推論のためのグラフ構造

機械学習技術 人工知能技術 深層学習技術 自然言語処理技術 セマンティックウェブ技術 知識情報処理 オントロジー技術 AI学会論文集を集めて デジタルトランスフォーメーション技術 本ブログのナビ
知識表現と推論のためのグラフ構造

Graph Structures for knowledge Representation and Reasoning 2020より。

知識表現と推論(KRR)のための効果的な技術の開発は、成功する知的システムの重要な側面である。これまで、様々な表現パラダイム、および、それらを用いた推論システムが広く研究されてきた。しかしながら、人工知能(AI)における知識表現では、ますます大規模になる情報集合を論理的に操作するという新たな課題、問題、問題が浮上している(例えば、セマンティックWeb、バイオインフォマティクスなど参照)。また、ストレージ容量や計算機性能の向上は、KRRシステムの性質に影響を与え、表現力と実行性能に焦点を移した。そのため、KRRの研究は大規模推論に最適な知識表現構造の開発という課題に直面している。この新世代のKRRシステムには、制約ネットワーク(CN)、ベイジアンネットワーク(BN)、 意味ネットワーク(SN)、概念グラフ(CG)、形式概念分析(FCA)、CP-net、GAI-net、論証フレームワークなどのグラフベースの知識表現フォーマリズムがあり、 これらはすべて多くのアプリケーションで成功裏に使用されてきた。Graph Structures for Knowledge Representation and Reasoning (GKR) ワークショップシリーズの目的は、グラフベースの知識表現形式と推論技術の開発と応用に携わる研究者を結集することである。本書は、ScaDS.AI — Center for Scalable Data Analytics and Artificial Intelligence Dresden/Leipzigの後援のもと、スペインのサンティアゴ・デ・コンポステーラで開催されるはずだった第24回欧州人工知能会議ECAI 2020と共同で行われた第6回のGKRの拡張・改訂版選択論文である。GKRもECAIのように、世界的なパンデミックを考慮して、バーチャル版に形を変えざるを得まなかった。これまでアメリカのパサデナ(2009年)、スペインのバルセロナ(2011年)、中国の北京(2013年)、アルゼンチンのブエノスアイレス(2015年)、オーストラリアのメルボルン(2017年)で開催されたGKRと比べて、初めてのことだった。それでも、前回同様、主要なAI国際会議との関連付けのおかげで、ワークショップは豊かで貴重な交流のための絶好の場となりました。ワークショップの投稿論文は、例年通り、プログラム委員会による一重盲検審査を受け、それぞれ2~3件の審査が行われた。この巻には、拡張ワークショップの論文に加えて、GKRコミュニティの中心メンバーによる2つの招待論文も収録されている。本ワークショップでは、概念グラフ、形式的概念分析、グラフモデル、グラフニューラルネットワーク、コンセプトダイアグラムなど、グラフベースの知識表現と推論に関する多くのトピックが取り上げられた。応用分野としては、スマートホーム、教育、チーム形成、エンタープライズアーキテクチャ、使用パターン分析などがあり、グラフベースのKR手法の応用範囲の広さが示された。第6回GKRワークショップは、異例の事態にもかかわらず、大成功を収めた。多様な分野から集まった論文は、いずれも知識表現と推論に関する様々な問題に取り組んでおり、グラフ理論的な背景が共通であることから、異なるコミュニティ間のギャップを埋めるのに役立った。このため、参加者は新しい洞察とインスピレーションを得ることができた。

エンタープライズアーキテクチャ(EA)のメタモデルは、組織のビジネス、情報、技術のリソースを調整し、これらの資産が組織の目的を最もよく満たすようにするものである。Layered EA Development (LEAD) Ontology は、意味的関係によって相互接続された層状のメタオブジェクトを構成要素として持つメタモデルによって、EA の実践を強化するものである。各メタオブジェクトは、相反する方向の2つの意味関係によって他のメタオブジェクトに接続し、各メタオブジェクトがその観点から他のメタオブジェクトをどのように見ているかを明らかにする。結果として得られる2つの有向グラフは、メタモデル内の複数の経路をすべて明らかにするが、より望ましいのは、経路の依存関係に焦点を当てた1つの有向グラフを持つことであろう。この目的のために、CG-FCA(CGは概念グラフ、FCAは形式的概念分析)とLEADのケーススタディを用い、メタオブジェクト間の受動的意味関係ではなく能動的意味関係を引き出すアルゴリズムを決定し、1つの有向グラフメタモデルを作成した。また、本アルゴリズムは、能動的・受動的関係を持つオブジェクトのトリプルで構成されるあらゆるメタモデルに一般的に適用可能であることを明らかにした。

人工知能アプリケーションでは、観測された環境に関する知識ベースを維持することがしばしば必要となる。特に、現在の知識が新しい情報と矛盾している場合、それを更新する必要がある。このような矛盾は、誤った仮定や環境の変化に起因することがある。ここでは、2番目のケースを考慮し、環境が進化しうる制約を考慮したイベントロジックに基づく知識更新アルゴリズムを開発した。これらの制約条件は、明確に定義された方法で環境を変更するイベントの形をとる。新しい観測によって引き起こされる信念の更新は、このように一連のイベントによって説明される。そして、このアルゴリズムをスマートホーム内の人の位置を特定する問題に適用し、過去の情報と移動の制約を考慮することで、位置推定が改善されることを示す。

精神疾患を支援するソフトウェアのニーズは、かつてないほど高まっています。精神疾患を患う人は、その必要性を認識していない、あるいは社会的・経済的に深刻な影響を受ける可能性があるため、心理療法士に相談することを避けている場合が多い。人間のセラピストによる理想的な治療と自助努力によるウェブサイトの間に、言語を使用するコンピュータとの有益な相互作用の可能性があるのだ。ここでは、近未来の自動化された心理療法士における文章生成のための共感的反応計画のモデルについて説明する。このモデルは、感情状態の追跡、患者の履歴からの文脈情報、継続的に更新される治療目標を組み合わせて、適切な概念グラフを形成し、その後、適切なテキスト文として実現することができる。

本研究の貢献は、人間の幸福の最適化のための創造的構成問題(CCP)を、知識表現を用いた知識グラフの構築と論理ベースの人工知能推論計画によって定義し、最適解の計算を動的計画法または論理計画法によって達成することである。創造的作文問題は、Well-beingとMental Healthのための対話スクリプトを作成するデジタルコンパニオン人工知能エージェントシステムCeciliaに組み込まれています。セシリアフレームワークは、大学1年生の幸福度を最適化するために、幸福とメンタルヘルス領域でインスタンス化される。我々は、「対話文作成問題(PCCD)」を定義し、その実現可能で最適な解決策を提案する。この応用領域でCCPをインスタンス化し、学生のメンタルヘルスとウェルビーイングを最適化するPCDCを解決する。PCDCとしてのCCPは、生徒の精神的健康を最大化するだけでなく、対話セッションが構成されるたびに、円滑さ、一貫性、楽しさ、関与を最大化するために適用されます。セシリアは、生徒がストレスや不安を管理し、うつ病の予防を試みることを支援します。学生はデジタルコンパニオンを通じて、質問と回答をすることで対話することができます。システムがユーザーから「学ぶ」一方で、ユーザーは自分から「学ぶ」ことができます。自分では気づかなかった要素を発見し、自分の改善点を発見することで、より良い改善策を見出すことができるのです。

本論文では、形式的概念分析(FCA)の意味での概念格子を用いた集合の可視化について、オイラー図による可視化との対比で論じる。どちらのタイプの可視化にも利点と欠点がある。両分野の関連性と両分野に存在する知識体系から、どちらかの分野の結果がもう一方に貢献できるかどうかを調査することは興味深いことである。

この数年、サブスクリプションプランを導入するプラットフォームが着実に増えてきています。この現象は、開発者を支援するだけでなく、質の高いコンテンツを提供し続けることにもつながります。しかし、お金をかけたくない人、お金がない人は、定額制のアカウントを共有することになります。このような行動は、場合によっては開発者にとって有害であり、そうでない場合でも、どのような顧客を抱えているかを知ることは、プロバイダーにとって有益なことです。この記事で紹介するソリューションは、簡単に入手できるデータを使用し、各アカウントの活動を把握できるように構造化することに重点を置いています。

ここでは、高度に分散した共同設計・製造環境において、重要でありながら日常的で時間のかかる活動を支援し、情報の構造化がどのようにそれを促進するかに注目します。そのために、我々は、チーム形成、パートナー選択、スケジューリング、およびコミュニケーションに対するシンプルで強力なアプローチを提示する。従来、このアプローチは、「近さ」や「ベストフィット」(メトリックベースのパラダイム)、またはツリー(データ構造)内のサブツリーを見つける(ツリートラバーサル)ことのいずれかの考え方を用いて行われてきた。その代わり、我々は概念格子を好んで、「包含」や「メンバーシップ」の概念を確立している:本質的に位相的なパラダイムである。我々のアプローチは実質的なものであるが、従来のアプローチと並行して使用することができ、このようにして複数のパラダイムの長所を利用することができるのである。

大規模で異質なデータセットは、情報の欠落や誤りによって特徴付けられる。これは、コミュニティの努力や、テキストなどの外部ソースからの自動的な事実抽出手法の産物である場合、より顕著になります。前述の現象の特別なケースは、知識グラフで見ることができ、これは主に欠落した、あるいは誤ったエッジやノードという形で現れます。このような不完全なグラフに対して構造化クエリを実行すると、たとえグラフ内に正しいエンティティが存在しても、パターンにマッチするために必要な1つ以上のエッジが欠けているため、不完全な回答セットが得られることになる。この問題を克服するために、近似的な構造化問い合わせ応答アルゴリズムがいくつか提案されている。現代の情報検索メトリクスに触発されたこれらのアルゴリズムは、グラフ内の全エンティティのランキングを生成し、さらにこのランキングで正しい答えがどれだけ上位に表示されるかに基づいてその性能が評価される。

本研究では、このような評価方法を批判的に検討する。ランキングに基づく評価では、複雑なクエリに答える手法を評価するのに十分でないと主張する。これを解決するために、我々はメッセージパッシングクエリボックス(MPQB)を導入し、二値分類メトリクスを再び使用するようにし、これが最近提案したクエリ埋め込み手法MPQEに与える影響を示す。

パターンとは、二項制約充足問題(CSP)の一般的なインスタンスで、変数-値の割り当てのある組の互換性が不特定である可能性があるものである。禁制パターンの概念により、CSPの新しいクラスがいくつか発見されている。しかし、この分野が成熟するためには、パターンの代数を理論的に研究する必要がある。我々は、禁制パターンの集合からなる格子と一般的なインスタンスの集合との間のガロア接続を提示し、その帰結を調査する。次に、パターンを拡張されたパターンに拡張し、同様のガロア接続を示す。拡張パターンは、平坦な(すなわち、非拡張)パターンよりも強力な言語であり、任意の、木幅がkで制限されるインスタンスは、平坦なパターンの有限集合を禁止することによって指定できないが、拡張パターンの有限集合によって指定できることを示すことによって、それを実証する。拡張パターンの有限集合は、各インスタンスがアリティkの弱い全会一致に近い多相性を持つようなインスタンスのクラスも記述できる(したがって、全ての扱いやすい言語クラスをカバーできる)。拡張パターンを禁止することの力を調べ、新しい扱いやすいクラスを記述する可能性を議論する。

コメント

  1. […] 知識表現と推論のためのグラフ構造 […]

タイトルとURLをコピーしました