KI 2020: Advances in Artificial Intelligence論文集より

機械学習技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 デジタルトランスフォーメーション技術 AI学会論文 知識情報処理技術 AI学会論文を集めて 推論技術 本ブログのナビ
KI2020

このプロシーディングスは、2020年9月21日から25日の間に、ドイツのバンベルグ大学主催で開催された第43回ドイツ人工知能会議(KI 2020)で発表された論文を収録している。COVID-19のため、KI 2020はこの会議シリーズの最初のバーチャル版となった。

人工知能に関するドイツ会議(”Künstliche Intelligenz “の略称でKI)は、45年前の1975年10月7日の第1回GI-SIG AI会議から、一連の非公式会議やワークショップが発展してきた。GI-SIG AIは、Gesellschaft für Informatik (GI) のFachbereich Künstliche Intelligenz (FBKI) の一部門で、毎年開催される定評ある会議シリーズとして、AI研究のあらゆる手法とトピック領域にわたる理論とアプリケーションの研究に専念している。KIは、主にドイツとその近隣諸国の研究者が参加しているが、海外からの参加も歓迎している。

KI 2020では、人間中心のAIに焦点を当て、特に教育におけるAIと説明可能な機械学習に焦点を当てている。これらのトピックは、パネルディスカッションやワークショップで取り上げられ、この会議では、AIのあらゆるトピックについて、原著論文や短い技術通信、システムのデモの記述などを募集した。さらに、最近開催された主要なAIカンファレンスで発表された論文をまとめた拡張アブストラクトの提出も奨励された。

KI 2020には13カ国から70件以上の応募があり、3名のプログラム委員による審査が行われた。8カ国53名の専門家からなるプログラム委員会は、16件をフルペーパーとして、12件を技術貢献として、4件を事前公開アブストラクトとして採択することを決定した。

プログラムには6つの招待講演が含まれている。

– アンソニー・G・コーン(英国リーズ大学):”Learning about Language and Action for Robots” (ロボットのための言語と行動の学習
– Hector Geffner, Institució Catalana de Recerca i Estudis Avançats and Universitat Pompeu Fabra, Spain: 「モデルフリーからモデルベースAIへ:プランニングのための表現学習” (英語)
– ヤーナ・ケーラー(ドイツ、DFKI)。「10120とその先。強力な産業最適化のための基盤としてのスケーラブルなAI検索アルゴリズム”.
– ナダ・ラブラ(ヨジェフ・ステファン研究所、スロベニア):”セマンティック・リレーショナル学習”
– セバスチャン・リーデル(Facebook AI Research and University College London, UK):”オープンブックとクローズドブックの機械読み”
– ウリ・ヴァルティンガー(シーメンス・コーポレート・テクノロジー、ドイツ 「インパーフェクションの美しさ。本大会は、5つのワークショップと7つのチュートリアルで補完されました。また、毎年恒例の博士課程コンソーシアムに加え、高校生や学士・修士課程の学生がAIプロジェクトを発表する学生デーが導入されている。COVID-19は、KI2020をいくつかの点で複雑化させたが、その結果、KI2020の成功につながった。

Contents

我々は、エージェントがアイテムに対して正、ゼロ、負の効用を持つ公正分割モデルを考察する。このモデルに対して、我々は1つの既存の公正特性-EFX-と3つの新しい、関連する特性-EFX0333-α/0/α3-α/0/β効用を分析し、このアルゴリズムもそのような割り当てを返す。また、いくつかの新しい不可能性の結果も報告する。

この論文では、ブリッジ、ハーツ、タロット、スカットなど、スートの従順性に依存する多人数参加型トリックテイキングカードゲームを取り上げる。このゲームでは、スートの要素でミニゲームを解くことを提案し、切り札または切り札以外のスートカードに限定したシングルダミーまたはダブルダミー分析ツールとしての応用を例証している。このようなファクター・ソルバは、主にミドルゲームにおいて、デクレアラーや対戦相手のカード選択を改善するために適用され、ポイント数やトリック数を最適化するために調整することが可能である。一見すると、ゲームを1つのスートに投影することは単純化しすぎですが、スート要素への分割アプローチは、静的なテーブル情報へのアクセスから動的なプレイへの段階移行で生じる明らかな問題を解決するため、柔軟で強力な武器となります。実験の結果、ミニゲームプレイを用いることで、トリックテイキングのSkat AIの強さを向上させることができることがわかった。

畳み込みニューラルネットワーク(CNN)はますます複雑化し、膨大な計算資源とエネルギーを必要とするようになってきている。本論文では、画像分類の文脈で、CNNが入力に条件付けられたチャンネルと層を動的に使用することを可能にする条件付き計算の方法を提案する。この目的のために、我々は、計算量のオーバーヘッドをあまり発生させずに二値的な決定を行うことができる軽量のゲーティングモジュールを組み合わせる。最近提案されたチャネルゲーティング機構とレイヤゲーティングを組み合わせることで、大規模なCNNの計算コストを大幅に削減できると主張する。離散的最適化アルゴリズムを用いて、ゲーティングモジュールは使用されるコンテキストを認識し、特定のチャンネルと特定のレイヤーを実行するかどうかを決定することができる。その結果、入力画像に応じたトポロジーを持つニューラルネットワークが実現される。CIFAR10とMNISTのデータセットを用いた実験では、計算資源を最大50%節約しながら、画像分類の精度に関して競争力のある結果を得られることが示されました。

近年、OCR を用いた歴史的な印刷物の自動転写は大きな進歩を遂げている。しかし、ページレイアウトが複雑な場合、特にテキストと非テキスト(絵や装飾されたイニシャルなど)を正しく分離することはまだ困難である。現在では、適切な学習素材があれば、エンコーダーデコーダー構造を持つ完全畳み込みニューラルネット(FCN)が選択されている。しかし、非テキスト要素のバリエーションは膨大であるため、学習素材とテスト素材が類似している場合、FCNの良好な結果は異なるレイアウトに容易に伝達されない。我々は、ページを多くの輪郭(すなわち連結成分)に分割し、標準的な畳み込みニューラルネット(CNN)を用いて各輪郭をテキストか非テキストかに分類するアプローチを提案する。CNN はテキストの輪郭、つまり文字を認識することを学習し、それ以外を非テキストとして分類する。したがって、非テキストの多くの形態に対してより良く一般化することができるというのが主な考え方である。この輪郭に基づくセグメンテーションは、従来のFCNと比較し、学習材料の量を変え、類似・非類似のテストデータで評価することで、その有効性を示している。

アルゴリズム選択(AS)は,アルゴリズム問題クラスの特定のインスタンスに対して,候補アルゴリズムの集合から最も適したアルゴリズムを自動的に選択するタスクと定義される.適合性には様々な基準があるが,特に実用的な関連性を持つのはランタイムである.経験的な実行時間情報を訓練データとして活用し、AS問題は一般的に回帰関数を適合させることで取り組まれる。そしてこの回帰関数は、新しい問題インスタンスに対する候補アルゴリズムの実行時間を推定するために使用できる。本論文では、回帰とランキングを組み合わせたアルゴリズム選択の新しいアプローチを開発する。この問題は、最近プリファレンス学習の領域で研究されているランキング学習としても知られている。アルゴリズム選択のために最終的に必要となるのはアルゴリズムのランキングのみであるため、実行時間の正確な数値推定は不要かつ不必要に難しい問題のように見える。しかし、実行時間の数値情報を完全に捨ててしまうことは、アルゴリズムの性能マージンに関する潜在的に有用な情報を学習者から隠してしまうことになり、良くない考えであると思われる。広範な実験的研究により、我々のハイブリッドアプローチの可能性が確認され、純粋な回帰手法や純粋なランキング手法よりもしばしば良い性能を示すことが示された。

Conditional Reasoning and Relevance

計画を実現するために,計画モデルはモデル化されたシステムの多くの細部を抽象化する.実際のシステムで計画を実行する際、臨界点でモデルが不正確になり、計画の実行が失敗することがあります。この場合の対処法としては、失敗した部分に対応するために前回の解を修正する(計画修復)か、新しい状況から計画プロセスをやり直す(再計画)かの2つがある。HTN計画では、計画を破棄して新しい状況から新しい計画を生成することは容易ではありません。なぜならHTN解の基準では、既に実行されたアクションを考慮する必要があるからです。そのため、文献にある全ての修復計画へのアプローチは、特殊なアルゴリズムに基づいている。本論文では、この問題を詳細に議論し、壊れたHTN計画を修復するために、変更されていない既製のHTN計画システムを使用することを可能にする新しいアプローチを紹介する。その方法では、特殊なソルバーは必要ない

条件付き知識ベースRは、”If A, the usually B “の形の条件文の集合である。Rの条件式から得られる構造情報を用いて、ワールドに対する優先構造関 係を導入する。好ましい構造関係は、Rで明示的に与えられた知識を帰納的に補完するシステムW推論と呼ばれる新しい推論関係の中核をなすものである。我々は、システムWがシステムPを満たし、例えばシステムZとは対照的に溺死問題を回避するような望ましい推論特性を示すことを示す。これはシステムZと懐疑的c-inferenceの両方を完全に捕らえ、厳密に拡張する。懐疑的c推論とは対照的に、複雑な制約充足問題を解く必要がなく、システムZと同様に扱いやすい。

自由論理学は、存在前提を一切持たない論理学の一種である。従来の古典論理や非古典論理とは異なり、非実在オブジェクトや部分関数のエレガントなモデル化をサポートし、コンピュータ科学、哲学、数学、自然言語意味論などの幅広い応用に関連する。自由一階論理はこれまでにも研究されてきたが、自由高階論理はこれまで十分に研究されてこなかった。本論文では、(i) 正の意味論による自由高次論理の概念と定義(一部はFarmerのChurchの単純型理論の部分関数版に触発された)の開発、(ii) 正自由高次論理の古典高次論理への忠実な浅い意味論の埋め込みを提供すること。(iii) この埋め込みをIsabelle/HOL証明アシスタントで実装すること、(iv) 我々の新しい推論フレームワークを、正自由数量化命題論理におけるプライヤーのパラドックスの自動評価のために例示的に適用すること、すなわち、. e., 正自由度高次論理の一部分である。

現在の教師付き学習モデルは、領域の境界を越えてうまく汎化できない。これは、ロボット工学や視覚分類などの多くの応用分野で知られている問題である。このような汎化特性を改善するために、領域適応の手法が用いられる。しかし、これらの手法は、視覚適応のような特定のタスクに限定される、多くの計算時間やデータを必要とし、必ずしも保証されていない、複雑なパラメータ設定、または高価な最適化手順を持つ、などの問題を抱えている。本論文では、十分に選択されたデータのスナップショットのみで、単一の領域不変部分空間を求めるアプローチを提案する。この部分空間は閉じた形で計算され、領域構造を上書きするため、高速で安定したパラメータ化が可能である。また、低ランクの手法を用いることで、データの記述的な特徴を重視する。本提案は、テキストや画像分類などの様々な領域適応タスクにおいて、最新の領域適応アプローチと比較して評価され、すべてのタスクにおいて顕著な性能を達成した

説明可能なAIは、信頼性や透明性が強く求められる領域において、ブラックボックス的な機械学習アプローチの重要な構成要素となりつつある。例えば、医療アシスタントシステムや、透明性を重要視する欧州連合の一般データ保護規則に関連するアプリケーションなどである。このような要求には、分類器の判断の背後にある根拠を監査する能力が必要です。可視化は説明のデファクトスタンダードであるが、表現力という点では多くの点で不十分である。視覚的特徴の異なる属性表示(例:目を開けているか閉じているか)を区別することができず、特徴の有無や関係性の影響を正確に表現することができない。代替案として、より表現力の高い記号代用モデルが考えられる。しかし、これらのモデルには記号入力が必要であり、ほとんどのコンピュータビジョンのタスクでは容易に利用できない。本論文では、これを克服する方法を検討する。我々はネットワークによって学習された固有の特徴を用いて、フィードフォワード畳み込みニューラルネットワーク(DNN)の論理的根拠のグローバルで表現力豊かな言語的説明を構築する。特徴のセマンティクスは、人間が理解しやすい視覚的な概念の集合で訓練された概念分析アプローチによって掘り起こされる。説明は帰納論理プログラミング(ILP)法によって求められ、一次ルールとして提示される。我々は、我々の説明が元のブラックボックスモデルに忠実であることを示す。
我々の実験のコードはこのhttpsのURLで公開されている。

産業応用やAIの問題の多くは、最大満足度(MaxSAT)として符号化することができる。多くの場合、任意の長い計算時間の後に最適解を得るよりも、実用的な結果を非常に短時間で得ることがより望ましい。本論文では、そのような目的のために、MaxSATのための新しいランダム化局所探索ヒューリスティックである安定解決法(SR)を提案する。SRは重み付けされたインスタンスと重み付けされていないインスタンスの両方に対して有効である。実現可能な初期解から出発して、このアルゴリズムは摂動、改善、解の確認の3つのステップを繰り返し実行する。摂動では、現在の解を悪化させる可能性を犠牲にして探索空間が探索される。局所的な改善では、過剰満足の節にある変数の符号を繰り返し反転させることによって行う。最後に、このアルゴリズムはシミュレーテッドアニーリング方式で解のチェックを行う。我々は、我々のアプローチを最新のMaxSATソルバーと比較し、毎年開催されるMaxSATコンペティションのベンチマークインスタンスを用いた数値実験により、SRが平均的に同等の性能を持ち、特定の問題インスタンスでは最高のソルバーとなることを示す。

ヨーロッパでは人口の高齢化が劇的に進んでおり、高齢者の日常生活支援はますます重要で関連性の高い研究テーマになっています。Movecareプロジェクトは、ロボットプラットフォーム、IoTシステム、アクティビティセンターを統合し、在宅のユーザーに支援、アクティビティの提案、透明性の高いモニタリングを提供することで、このテーマに焦点を当てている。本論文では、Movecareプラットフォームのソフトウェアコンポーネントであり、様々なモジュールからのデータを分析し、ユーザーの状態やニーズに合わせた提案を生成する役割を担う、Virtual Caregiverについて説明します。15名のユーザーを対象に、2ヶ月間の予備調査を実施しました。その結果、バーチャルケアギバーの存在がムーヴケアプラットフォームの利用を促し、認知・身体機能低下のモニタリングや予防につながる可能性があることが示唆されました。

マルチエージェント組織では、問題解決能力の調整が、複雑なタスクを処理するための基盤を構築する。役割は、タスク処理の責任を集約するための構造的なアプローチを提供する。しかし、役割の設定は個人とチームのパフォーマンスに影響を与えるため、役割を設計することは依然として困難である。一方で、役割を特定のタスクに特化させることで、効率的な問題解決を可能にします。しかし、その反面、外乱時のタスク処理の柔軟性が損なわれる。また、エージェントがある役割を演じることで経験知識を得ると、役割の切り替えが困難になり、訓練が必要となる。そこで、本論文では、異なる役割設計が実行時の学習エージェントに与える影響について検討する。我々は、適応的な信念・欲求・意図エージェントアーキテクチャと強化学習アプローチを組み合わせて、確率的環境における経験知識、タスク処理の改善、意思決定のモデルを構築する。このモデルは、エージェントが消防署を管理し、緊急活動を設定・制御する緊急対応シミュレーションを用いて評価される。その結果、特化型エージェントは一般型エージェントよりも効率的に与えられたタスクを処理するように学習することが示された。

HanssonによるDescriptor revisionは、信念の変化の問題に対処するためのフレームワークである。記述子改訂では、異なる種類の変更プロセスが共同のフレームワークで扱われる。個々の変更要件は、信念記述子によって表現される特定の成功条件によって修飾され、信念記述子は論理接続子によって結合することができる。これは、Alchourrón、Gärdenfors、Makinsonによって形成された現在主流のAGMパラダイムとは対照的であり、改訂や縮小といった異なる種類の変更が別々に扱われる。この論文では、記述子をリテラル記述子の接続に制限しながら、条件付き論理のための記述子の改訂の実現について調査する。Kern-Isbernerによって開発された条件保存の原理を条件論理の記述子修正に適用し、この制約の下での条件論理の記述子修正がいかに制約充足問題によって特徴付けられるかを示し、制約論理プログラミングを用いてそれを実現する。この条件付き論理は命題論理を包含するため、我々のアプローチは命題論理に対する記述子修正も実現する。

連続的な動きと時間を持つマルチエージェントの経路探索(MAPFR )に取り組んでいる。この課題は、あらかじめ定義された位置の間を滑らかに移動するエージェントを、衝突しないようにそれぞれのゴールまでナビゲートすることである。最近、SMT-CBSRと呼ばれる、満足度モジュロ理論(SMT)に基づく、メイクスパン最適解を得るための新しい解法が紹介された。我々は、このアプローチを、より複雑な目的計算のためにyes/no SMT環境においてより困難なケースであるコスト和の目的に向かってさらに拡張する。新しいアルゴリズムは、潜在的に数え切れない探索空間における決定変数を選択するための新しいスキームの上に、衝突に基づく探索(CBS)から知られる衝突解決と、不完全なSATエンコーディングの前世代を組み合わせたものである。我々は、SMT-CBSRと従来のCCBS(連続衝突に基づく探索)アルゴリズムをMAPFRに対して実験的に比較した。

Abstracts of Pre-published Papers

本論文は、第29回国際人工知能連合会議(IJCAI 2020)のプロシーディングスに掲載予定の論文「Cone Semantics for Logics with Negation」の拡張要旨である。

Databionic swarm (DBS) は柔軟で頑健なクラスタリングフレームワークであり、群ベースの投影、高次元データの可視化、表現誘導型クラスタリングの3つの独立したモジュールで構成されている。最初のモジュールは、自己組織化、創発、ゲーム理論、群知能の概念を利用したパラメータフリー投影法Pswarmです。2つ目のモジュールは、トポグラフィックマップと呼ばれるパラメータフリーの高次元データ可視化技術である。一般化されたU行列を用いることで、第一にクラスタ傾向が存在するかどうか、第二にクラスタ数の推定を行うことが可能である。第3のモジュールは、可視化によって検証可能なクラスタリング手法を提供し、その逆も可能である。従来のアルゴリズムに対するベンチマークを行った結果、DBSは従来のアルゴリズムよりも優れた性能を発揮することが示された。また、いくつかのアプリケーションにより、DBSが提供するクラスタ構造が有意義であることが示された。この記事はSwarm Intelligence for Self-Organized Clustering [1]のアブストラクトである。

画像復元の目的は、損傷した画像の元の状態を回復することである。従来の手作業による画像修復は、時間がかかる、専門知識が必要といった欠点があり、これを克服するために、自動修復法が開発されました。しかし、これらの方法は、複雑な画像に対しては限界があり、また、多くの入力データを必要とする場合があります。そこで、手動と自動を組み合わせたDeep-Image-Priorに基づく復元を、人間がループに入った対話型のプロセスとして行う「interactive Deep Image Prior」を発表します。このプロセスでは、人間が反復的に知識を埋め込み、自動化されたインペインティングプロセスにガイダンスと制御を提供することができます。この目的のために、我々はDeep Image Priorをユーザーインターフェースで拡張し、その後、ユーザースタディで分析しました。私たちの主な疑問は、対話性によって主観的・客観的に修復品質が向上するかどうかということです。また、このような協調的なシステムがユーザーによってどのように認識されるかということにも関心がありました。

その結果、人間がほとんど介在しなくても、我々の対話型手法は他の手法と同等かそれ以上の修復性能を発揮することが分かりました。また、ユーザー調査の結果、人間がループに入った学習システムは、ユーザーの満足度にプラスに働くことが示唆され、非常に好評でした。したがって、人間の知識が修正や指導に影響を与える可能性のある画像復元や他のMLタスクにおいて、対話的で協調的なアプローチが有効な選択肢であると結論付けることができる。

Technical Contributions

将来の知的自律システム(IAS)は、例えば自動運転車、ヘルスケア、人間と機械の協働などにおいて、必然的に道徳的・法的問題を決定することになる。現代のほとんどのサブシンボリックなIASにおける意思決定プロセスは隠蔽されているため、透明性、説明責任、ガバナンスのための単純な政治的嘆願は不十分である。信頼の健全なエコシステムには、IASが自律的にその行動を正当化する方法、つまり、その意思決定の理由を与えたり、受け取ったりすることを学ぶ方法が必要である。道徳心理学や法哲学における社会的推論モデルを基にした「合理的な機械(Reasonable Machines)」という考え方は、新しいハイブリッド推論ツール、倫理的・法的オントロジー、および関連する論証技術を必要とします。機械に規範的なコミュニケーションを可能にすることは、信頼を生み、AIの応用と人間と機械の相互作用の新しい次元を開くことになる。

人間は、他のエージェントの行動を観察するだけで、意図を認識することができる。したがって、協調的計画タスク、すなわち、全てのエージェントが他の全てのエージェントがそれぞれのゴールに到達することを目指す場合、ある程度はコミュニケーションや中央計画インスタンスは不要である。エピステミックプランニングでは、ゴールの不確実性を伴うマルチエージェントプランニング問題(MAPF)が最近の研究課題である。本論文では、各エージェントが各ラウンドで移動または待機する、この問題のラウンドベースのバリエーションを提案し、分析する。我々は、認知からの単純なヒューリスティックが、場合によっては適応された形式的アプローチを計算時間において上回り、場合によってはいくつかの新しいインスタンスを解くことができることを示す。その意味するところを議論する。

金融分野において、企業の将来の財務パフォーマンスを確実に予測することは、投資家の投資判断に非常に重要である。本論文では、長期短期記憶(LSTM)ネットワークと時間畳み込みネットワーク(TCN)を、将来の一株当たり利益(EPS)の予測において比較する。実験分析は、四半期ごとの財務報告データと日々の株式市場リターンに基づいている。米国企業の広範なサンプルに対して、LSTMはナイーブな持続的モデルを30.0%上回る予測精度を達成し、TCNは30.8%の改善を達成することを見出した。両者とも、少なくともアナリストと同等の精度を持ち、最大で12.2%(LSTM)、13.2%(TCN)上回ることができた。

レコメンダーシステムの重要な部分は、ユーザーの以前のインタラクションに基づく嗜好をモデル化することである。これまでにも、一連のインタラクションに基づいて次のアイテムを予測する様々なニューラルネットワーク(例えば、Recurrent Neural Networks)が逐次推薦に適用され、成功している。最近、Transformerモデルに基づくBERTアーキテクチャとNeural Language Modelingコミュニティで使用されている学習方法をこのタスクに適応させたBERT4Recが提案されています。しかし、BERT4Recは、ユーザの嗜好をモデル化するために、まだ項目識別子にのみ依存しており、他の情報源を無視している。そこで、追加情報を含めるための最初のステップとして、項目のキーワード記述を利用するBERT4Recの改良版であるKeBERT4Recを提案する。我々は、Movielensのデータセットとオンラインファッション店のデータセットの2つのデータセットで、モデルにキーワードを追加する2つのバリエーションを比較した。最初の結果では、我々のモデルの両バージョンは、BERT4Recと比較して、逐次推薦タスクを改善することが示された。

実世界の状況をモデル化するために、特に医療分野では様々なアプローチが検討されており、その多くは確率やその他の数値パラメータに基づくものである。本論文では、ある哺乳類の分類のモデル化、マラリア病原体の感染のモデル化、慢性骨髄性白血病の予後の予測という3つのケーススタディを通して、生物医学領域の実世界の状況が定性的条件文によっていかに便利にモデル化されるかを示す。モデル化すべき知識は、定性的条件論理を用いて直接かつ宣言的に表現できることを示す。例えば、条件論理は非単調推論をサポートするので、一般的なルールに対する例外を扱うのは簡単である。それぞれの知識ベースは、問い合わせ例と、p-entailment、システムZ、c-表現に基づく様々な推論関係など、条件付き知識のために提案されてきた様々な推論機構に関して評価される。得られた推論結果を人間の専門家が期待する答えと比較することで、モデリングアプローチの実現可能性を示し、また、現実的な応用シナリオにおいて採用した非単調推論関係の経験的評価を提供する。

我々は、ルールベースのマルチラベル分類(MLC)を強化するために、コンフォーマル予測(CP)の利用を提唱している。特に、CPとルール学習の相互の利点を強調する。ルールはCPが必要とする自然な(非)適合性スコアを提供する能力を持ち、CPは候補ルールの評価を較正する方法を提案し、それによってより良い予測とより精巧な意思決定を支援する。我々は、較正された適合性スコアの潜在的有用性を、遅延型マルチラベルルール学習のケーススタディで説明する。

制約問題の性能は、しばしば、部分問題を単一の正則制約に変換することで向上させることができる。我々は、異なる種類のグローバル制約から正則制約への制約変換、およびそれらの組合せを用いた制約充足(最適化)問題の新しいアプローチについて説明する。我々の変換アプローチには2つの狙いがある。1.共有変数に対する意味的に重複する制約に起因する冗長性を除去すること、2.解法プロセス中の探索におけるバックトラックの起源を除去することである。倉庫立地問題のケーススタディに基づき、我々の新しいアプローチが大幅なスピードアップをもたらすことを示す。

エンティティ間の関係をモデル化したナレッジグラフは、豊富で構造化された情報源を提供する。現在、検索エンジンは、例えば知識グラフから得られる構造化された要約によって検索結果を豊かにし、関心のある実体に関する更なる情報を提供することを目的としている。単一エンティティの要約はすでに利用可能であるが、複数エンティティ間の関係に関する要約はこれまで詳しく研究されていない。このような問い合わせは、経路探索問題として理解することができる。しかし、Wikidataのような公共の知識グラフはサイズが大きいだけでなく、その主要な実体の次数が大きく、概念ドリフトの問題があるため、この文脈では標準的な検索アルゴリズムに大きな課題を課す。
本論文では、有向知識グラフの双方向経路探索手法を提案する。この手法は、単語ベクトルで近似した実体ラベル間の意味的距離を、パラメータ化したA*様評価関数における探索ヒューリスティックとして用い、二つの実体間の意味のある経路を高速に探索するものである。我々は、選択されたドメイン内およびクロスドメインクエリの集合に対して、異なるパラメータを用いて我々のアプローチを評価した。その結果、本アプローチは、情報を与えない場合と比較して、より少ないエンティティを探索する必要があり、定性的にはより意味のある経路を生成することが示された。

本研究では、ISIC2018チャレンジのタスク2のために、視覚的なダーモスコピック属性の位置を自動的に予測するための新しいアプローチを提案する。我々の手法は、マルチスケール画像を入力とする”U-netの概要とアルゴリズム及び実装例について“で述べているアテンションU-Netに基づく。我々は、”転移学習の概要とアルゴリズムおよび実装例について“で述べている転移学習に基づく新しい戦略、すなわち、セグメンテーションのために訓練されたネットワークの重みを適応させることによって、特徴抽出のための深層ネットワークを訓練することを適用します。我々のテストでは、まず、提案アルゴリズムは、2つの視覚的特徴の抽出において、ISIC 2018のベストアーキテクチャ(LeHealthとNMN)と同等かそれよりも優れていることが示された。第二に、それは学習パラメータの1/30しか使用しません。我々は、より少ない計算とメモリ要件を観察し、これは特にモバイルデバイス上の将来の実装に有用です。最後に、我々のアプローチは、医師が診断や治療を決定する際に役立つ不確実性推定を伴う視覚的に説明可能な動作を生成する。

ディープラーニングは、クラウドからエッジへとどんどん移行しています。そのため、適度に安価でエネルギー効率が良く、十分な速度のある組み込みデバイスが必要とされています。この論文では、ディープラーニングの推論を行うための一般的な市販のデバイスの性能とエネルギー消費量を評価します。Intel Neural Compute Stick 2、Google Coral Edge TPU、Nvidia Jetson NanoをRaspberry Pi 4と比較し、式学生ドライバーレスの自律走行車の中央制御装置としての適性を評価する。

我々は、与えられたオブジェクトの集合から選択することを学習する問題を考える。ここで、各オブジェクトは特徴ベクトルによって表現される。従来の選択モデリングでは、潜在的な実数値の効用関数を学習することにより、選択候補の線形順序を誘導することが主なアプローチであった。このアプローチは離散的な(トップ1)選択には適しているが、部分集合の選択に用いるのは簡単ではない。我々は、選択候補を実数直線に写像する代わりに、高次元効用空間に埋め込むことを提案し、その中でパレート最適点を持つ選択集合を同定する。この目的のために、我々はこのタスクに適した微分可能な損失関数を最小化する学習アルゴリズムを提案する。我々は、一連のベンチマークデータセットにおいて、パレート埋め込み学習が可能であることを実証する

音声によるロボット教示は、一般家庭や中小企業で期待されている分野である。特に、ユーザーが他の作業を行っている間、専門家だけでなく非専門家にとってもロボットシステムの利用が容易になります。言語的なあいまいさや不確実性に加え、ユーザーはロボットの能力について何も知らない可能性があることも考慮しなければならない。そのため、ロボットの性能に不具合が生じたり、修理不能な損傷を受けたりして、ロボットに対する信頼が失われる可能性がある。我々は、口頭で指示された力に基づくロボットの動作を、物理シミュレーションを用いて検証するフレームワークを提案する。これにより、誤動作を防ぎ、例外的な結果であっても動作を生成することができる。概念実証として、このフレームワークを家庭用ユースケースに適用し、その結果について議論する。

消防士のストレスを分類するには、正確なパーソナライズされたラベリング、邪魔にならない記録、適切なモデルのトレーニングなどの課題があります。ラベル付けされたデータの取得や、ケージ迷路での検証、ホットトレーニング中の検証には時間がかかります。バーチャルリアリティ(VR)とモノのインターネット(IoT)ウェアラブルは、没入型シミュレーションを通じて、消防士の任務のためのより良いストレス要因を作り出すための新しい機会を提供します。このデモでは、消防士のミッションをシミュレーションして、特定のストレスレベルを誘発し、より簡単に記録することを可能にするVRベースのセットアップを紹介します。その目的は、心電図RR間隔からの心拍変動など、複数の生体信号を含むパーソナライズされたマルチレベルストレス検出モデル用のラベル付きデータセットを作成することです。マルチレベルストレスの設定は、異なるレベルの精神的ストレス要因から構成され、設定可能である。デモでは、パーソナライズされたストレスキャリブレーションを作成するために、ベースラインとチャレンジレベルを変化させた仮想ミッションの記録を確立した方法を紹介します。

AIの個々の下位分野が発展するにつれて、複雑なシステムへの統合を研究することがますます重要になってきている。この論文では、AIの全分野にわたる問題、データ、解決策、およびそれらの統合を共通の言語でモデル化するための共通基盤を提供する試みとして、AIドメイン定義言語(AIDDL)の初見について述べる。我々は、自動化された計画がどのように学習や推論と統合されるかの3つの例を見ている。

Abstract of a Pre-published Paper

本論文では、専門家の助言の下での予測の最適化に関する機械学習理論の結果と確率的集約の理論を結合する。確率集約の理論では、線形集約の特徴付けの結果がいくつか存在する。しかし、線形集約では、重みは固定ではなく、自由パラメータである。我々は、このような重みを成功ベースのスコアで固定することで、前述の最適化結果を確率的集約の場合にどのように移行できるかを示す。

コメント

タイトルとURLをコピーしました