人工知能技術

ここでは人工知能技術に関して以下のマップに示される領域の情報について述べている。

以下それぞれの詳細について述べる。

人工知能技術について

人工知能は、人為的に人間らしく振る舞うように作られた装置(またはソフトウェア)」と定義できる。この人工知能という言葉は1956年のダートマス会議で生まれている。初期の人工知能は、ハードウェアのパワーが大幅に不足していたこともあり、現在の機械学習に見られるような大量のメモリとCPUパワーを消費する大規模な計算は不得意で、その代わりに条件分岐を多用した自動判定プログラムを使った小規模な「推論」や「探索」、また暗号解読などで実践されていた。そのダートマス会議から70年近く経ち、人工知能技術の及ぶ範囲は非常に広範囲に及んでいる。

本ブログでは 以下のページにて、これらの人工知能技術の中で、特に機械学習技術以外の技術に関して述べられている。

人工知能技術の理論と基本的なアルゴリズム

機械学習以外の人工知能技術には「推論」や「探索」などの情報への論理的なアプローチを行うための技術が適用されている。

本ブログでは 以下のページにて、人工知能技術の理論と基本的なアルゴリズムとして、「人工知能技術とは」「情報理論&計算機工学」「基本的なアルゴリズム」「論理学」「圏論」「動的計画法」「Genetic AlgorithmとPSO(Particle Swarm Optimisation)」等について述べる。

グラフデータアルゴリズム

グラフはものや状態といった対象同士の結びつきを表すための表現方法となる。多くの問題をグラフの問題に帰着することができるため、グラフに関するアルゴリズムが多く提案されている。

本ブログでは 以下のページにてこのグラフデータの基本的なアルゴリズムである探索アルゴリズム、最短経路アルゴリズム、最小全域木アルゴリズム、データフローアルゴリズム、強連結成分分解をベースとしたDAG、SAT、LCA、決定木等のさまざまなアルゴリズムとグラフ構造をベースとした知識データ処理、ベイズ処理等の応用について述べている。

オートマトンと状態遷移/ペトリネット、自動計画と数え上げ問題

オートマトン理論は、計算理論の分野の1つであり、コンピュータ科学において重要な理論の1つとなる。オートマトン理論は、有限状態機械(FSM)やプッシュダウンオートマトン、チューリングマシンなどの抽象的な計算機モデルを研究することによって、形式言語、形式文法、計算能力、計算可能性、自然言語処理などの問題を解決するために応用される。

有限状態マシン (Finite State Machine, FSM) は、入力シーケンスに対して状態を遷移させる計算機の一種となる。FSMは、入力として与えられたシーケンスを読み込み、ある状態から別の状態へと移動する有限状態遷移図を用いて表現される。FSMは、状態遷移図を使って、入力を受け取ると現在の状態を変更し、適切な出力を生成することができる。

ペトリネットは、オートマトン理論の一種であり、並行システムのモデリングに使用されるグラフィカルなモデリング言語の一つとなる。ペトリネットは、1962年にカール・アダム・ペトリによって考案され、工業制御やソフトウェアエンジニアリングなどの分野で広く使用されている。

自動計画 (Automated Planning) は、ある目標状態に到達するためのアクションのシーケンスを自動的に生成する技術となる。自動計画は、コンピューターサイエンス、人工知能、ロボット工学などの分野で研究されている。

本ブログでは 以下のページにて、これらオートマトンと状態遷移/ペトリネットと自動計画に関して、理論、具体的な活用事例と実装など様々な情報を記載している。

機械学習のハードウェアからのアプローチ – FPGA・光コンピューティング・量子コンピューティング

現在のコンピューターは、この数を表し、計算するのには制御の容易性から電気を使った処理が主流となっているが、電気以外の媒体としてはこれまでに、蒸気、光、磁気、量子等さまざまなものが利用され、それぞれの特徴を持っている。

本ブログでは、 以下のページにてコンピュータのしくみから始まる計算機の基本原理について述べた後、計算の対象を機械学習に絞り、最もシンプルな機械であるRaspberry Piでの機械学習について述べ、次に機械学習専用のコンピューターとしてFPGAやASICを用いたケースについて述べる。さらに次世代のコンピューターとして量子コンピューティングや光コンピューターについても述べたいと思う。

自然言語処理技術

ことばは、人と人のコミュニケーションに用いられる道具となる。人間がことばを身につけることは容易で、特別な才能や長く地道な訓練などは必要ない。ところが、人間以外が言葉を操るのは不可能に近いほど難しい。言葉はとても不思議な存在となる。

自然言語処理は、そんなことばをコンピューターで取り扱おうとする研究となる。当初の自然言語処理は「ことばとは、このようなものだ」という規則を書き連ねることで実現していた。しかし、ことばは極めて多様で、常に変化し、人や文脈によって解釈が異なりうる。そのすべてを規則として記すのは現実的ではなく、その後規則による自然言語処理に代わって1990年代後半よりデータ、すなわち実際の自然言語の分に基づく統計的な推論が主流となっていく。統計的な自然言語処理とは、乱暴にいえば「言葉が実際にどのように使われているのか」というモデルをたてて問題を解くものとなる。

本ブログでは 以下のページにて、このようなコンピューターを使った自然言語処理に対して、まず「自然言語とはどんなものか」という観点から(2)哲学、言語学、数学からみた自然言語について述べ、更に(3)自然言語処理技術全般、更にそれらの中でも特に重要な(4)言葉の類似性(similarity)について詳細に述べている。そしてそれらをコンピューターの中で利用するための(5)各種ツールと、具体的なプログラミング(6)実装について述べ、現実のタスクに活用できるような情報について述べている。

知識データとその活用

知識を情報としてどのようにして扱うかうのかという問題は、人工知能技術のの中心議題であり、コンピューターが発明されて以来様々な検討が行われてきた。

ここで言う知識は、自然言語で表され、さらにコンピューターで扱えるような情報に変換されて計算されることになり、知識をどのような形で表現するのか?や表現された知識をどのように扱うのか?あるいはさまざまなデータ/情報の中から知識をどのようにして抽出するのか?等の課題に対して様々な検討が行われている。

本ブログでは 以下のページで、これらの知識情報のハンドリングに対して、知識の定義、セマンティックウェブ技術/オントロジーによるアプローチ、数理論理学をベースとした述語論理、Prolog等を用いた論理プログミング、さらにそれらの応用としての解集合プログラミング等について述べている。

オントロジー技術

オントロジーとは、哲学的には存在の本質や存在そのものを研究する学問であり、情報科学や知識工学の分野では、情報の体系化やデータの構造化を行うための形式的なモデルや枠組みのことを言う。

オントロジーを用いると、概念や事物、属性、関係などの情報を体系化し、共有可能な形式で表現することが可能となる。それらは、情報検索、データベース設計、知識管理、自然言語処理、人工知能、セマンティックウェブなどの多様な分野で、異なるシステムやアプリケーション間でのデータの一貫性や相互運用性を向上させるために利用される。また、ドメイン固有のオントロジーもあり、特定の分野や業界での情報の共有や統合を支援するためにも使用されている。

本ブログでは 以下のページにて、情報工学の観点からこのオントロジーの活用について述べる。

Semantic Web技術

Semantic Web技術とは「Webページの意味を扱うことを可能とする標準やツール群の開発によってワールド・ワイド・ウェブの利便性を向上させるプロジェクト」であり、現在のWWWの「ドキュメントの網」から「データの網」にweb技術を進化させるものとなる。

そこで扱われるデータはDIKW(Data Information Knowledge Wisdom)ピラミッドでのDataではなく、InformationやKnowledgeの情報となり、オントロジーやRDFなどの知識を表現するフレームワークで表現されており、様々なDXやAIのタスクに活用されている。

本ブログでは 以下のページで、このセマンティックウェブ技術やオントロジー技術、またセマンティックウェブ技術の世界的な学会であるISWC(International Semantic Web Conference)の情報等の学会論文について述べている。

推論技術

推論手法には、ある文や命題の集まりから別の命題を導く演繹法と、演繹方以外の推論手法として、帰納法、投射法、類比法、アブダクション法の4つの非演繹法がある。推論とは基本的には様々な事実の関係性をたどる手法だと定義することができる。

それらを見つけるアルゴリズムとして、古典的なアプローチとしては、前向き推論と後ろ向き推論がある。また機械学習的なものとしては、関係性を求める関係学習決定木を用いたルール推論シーケンシャルパターンマイニング、あるいは確率的生成手法等様々なアプローチがある。

推論技術は、そのような様々な手法、アルゴリズムを組み合わせてユーザーの望む推論結果を得る技術となる。

本ブログの 以下のページで、エキスパートシステムに代表される古典的推論、充足可能性問題(SAT)の活用、論理プログラミングとしての解集合プログラミング、帰納論理プログラミング等について述べる。

人工生命とエージェント

人工生命は、人間によって設計、作製された生命生化学コンピュータ上のモデルやロボットを使って、生命をシミュレーションすることで、生命に関するシステム(生命プロセスと進化)を研究する分野である。「人工生命」は1986年にアメリカの理論的生物学者、クリストファー・ラングトンによって命名された。人工生命は生物学的現象を「再現」しようと試みる点で生物学を補うものである。また、人工生命(Artificial Life)を ALife と呼ぶことがある。手段によってそれぞれ、「ソフトALife」(コンピュータ上のソフトウェア)、「ハードALife」(ロボット)、「ウェットALife」(生化学)と呼ばれる。

近年の哲学の議論では、知能が発現するキッカケとなるものの一つが生命であり、意図(生きていく方向性)から、関係性に意味が生じてくるというものがある。(xx意味論)その観点からも、何らかの生命の働きを機械(コンピューター)で代替させ、それを人工知能システムにフィードバックさせることは妥当なアプローチとなる。

本ブログの 以下のページにて、哲学的観点、数学的観点、人工知能的観点からそれらについて述べる。

チャットボットと質疑応答技術について

チャットボット技術は、さまざまなビジネスドメインでの汎用的なユーザーインターフェースとして利用することができ、そのビジネスチャンスの多様性から現在では多くの企業が参入している領域となる。

さらにそれらのベースにある質疑応答技術から見ると、単なるユーザーインターフェース技術ででは収まらず、自然言語処理技術や推論技術等の人工知能技術や、深層学習、強化学習、オンライン学習等の機械学習技術を組み合わされた高度な技術の集大成となるが、現時点でのチャットボットは、それらを駆使したものでは無く、ルールベースの非常にシンプルなものだけとなる。

本ブログでは 以下のページにて、このチャットボットと質疑応答技術に関して、その成り立ちからビジネス的側面、最新のアプローチを含めた技術的な概要とすぐ利用できる具体的な実装までのさまざまなトピックについて述べている。

Visualization & UX

コンピューターを使ってデータを処理するということは、データの中にある構造をビジュアライゼーションすることで価値を生み出しいくいくことと等価となる。さらに、データ自体には複数の視点で複数の解釈が可能であり、それらをビジュアライゼーションしていくためには、巧妙に設計されたユーザーインターフェースも必要となる。

本ブログの 以下のページにて、主にISWC等の学会に発表された論文を中心に、このユーザーインターフェースの様々な事例について述べる。

ワークフロー&サービス

ISWC等に掲載されたサービスプラットフォーム、ワークフロー分析、実ビジネスへの応用へ応用に対する論文を中心とした情報をまとめる。

本ブログでは 以下のページで、医療、法律、製造業、科学等のビジネスドメインに対するセマンティックウェブを使ったサービスプラットフォームについて述べている。

自律的な人工知能と自己拡張を行う機械

    Comming soon

    画像情報処理技術

    現代のインターネット技術やスマーフォンの発展により、web上には膨大な画像が溢れている。この膨大な画像から新たな価値を生み出す技術として、計算機による画像認識技術がある。この画像認識技術は、画像固有の制約条件やパターン認織・機械学習の知見のみならず、応用先の専権的な知識も必要とするため、取り扱う領域が必然的に広くなる。また深層学習の成功を発端とする近年の人工知能ブームの影響もあり、画像認識に関する膨大な研究論文が発表され、それらをフォローするのは困難な状況となっている。このように画像認識の内容は広大でかつ膨大であるために、明確な指針もなく全体を俯瞰し、知識を習得することは困難となる。

    本ブログの 以下のページではそれら画像情報処理技術に対する理論的とアルゴリズム、そしてpython/Kerasを用いた深層学習による具体的な活用やスパースモデルや確率生成モデルによるアプローチなどについて述べた。

    音声認識技術

    機械学習技術の適用先として、信号処理の領域がある。これらは主に時間軸上で変化する一次元のデータで、各種センサーデータや音声信号処理等がある。この音声信号認識には深層学習をはじめとする様々な機械学習技術がで起用される。

    本ブログでは 以下のページで、この音声認識技術に関して、自然言語と音声のメカニズムから、AD変換やフーリエ変換、そして動的計画法(DP法)、隠れマルコフモデル(HMM)、深層学習等の手法を使った話者適応や話者認識、耐雑音音声認識などの応用について述べる。

    地理空間情報処理

    地理空間情報とは、位置の情報もしくは、位置と結びついた情報を指す。例えば、LOD等に利用される行政で扱う情報の80%は何らかの位置情報と結びついていると言われ、極論すると、情報が発生した場所を情報と一緒に記録すると、すべての情報が「地理空間情報」ということもできる。

    この位置と結びついて情報を扱うことで、単純に地図の上に位置情報をプロットするだけでも、情報の分布状況を把握する事ができ、GPS等を用いて緯度軽度に結び付けた道路や目的地のデータがあると、GPS付きの端末を持った人を目的の場所へ誘導したり、どういった動きをしたかという軌跡を取ることにより、緯度軽度と結びついて過去・現在。未来の出来事の情報で、位置を元にサービスを提供することもできる。

    このような位置情報の特徴をうまく活用することで、新たな科学的な発見や、ビジネスでのサービスの展開、またさまざまな社会問題の解決が可能となる。

    本ブログでは 以下のページにて、この地理空間情報の活用として地理情報のプラットフォームであるQGISの具体的な利用方法、またそれらとRや各種機械学習ツールとの組み合わせ、またベイズモデルとの組み合わせ等について述べる。

    センサーデータ&IOT

    センサー情報の活用はIOT技術の中心的な要素となる。センサーのデータとしては様々なものがあるがここでは1次元の時間的に変化する情報を対象として述べる。

    IOTのアプローチとしては、特定の測定対象に対して個別にセンサーを設定し、その測定対象の特性を詳細に解析するタイプののものと、「異常検知へのスパースモデルの適用」にも述べられているように複数のセンサーを複数の対象に向けて設置し、得られたデータの中から特定のデータを選択して、特定の対象に対して異常検知を行う等の判定を実施するものに分けられる。

    本ブログでは 以下のページに、各種IOTの規格(WoT等)や時系列データとして統計的処理、隠れマルコフモデル等の確率的精製モデル、劣モジュラ最適化によるセンサ配置最適化、BLE等のハードウェアの制御、スマートシティ等幅広い領域の知見について述べる。

    異常検知と変化検知

    あらゆるビジネスの現場で、変化あるいは異常の兆候を捉えることは非常に重要な課題となる。例えば売り上げの変化を捉えることでいち早く次の一手を打ったり、稼働中の化学プラントの異常の兆候を見つけることで、重大な事故を未然に防いだり、現場の職人芸に頼らず、客観的にこれらの行うことはデジタルトランスフォーメーション人工知能のタスクを考える上で非常に意義があるものとなる。

    これらに対するアプローチとしては、ルールを抽出するもの以外に、統計的機械学習の技術を使うことで、実用に耐えうる異常検知・変化検知の仕組みが構築できるようになってきた。これは観測値をxとすると、その取りうる値についての確率分布p(x)を使って数式で異常や変化の条件を記述するもので、汎用的な手法となる。

    本ブログでは 以下のページに、この異常検知・変化検知のの具体的な技術としてホテリングのT2法から始まり、ベイズ法、近傍法、混合分布モデル、サポートベクトルマシン、ガウス過程回帰、疎構造学習など多様なアプローチについ述べている。

    ストリームデータ技術

    この世の中は静的なデータではなく動的なデータに溢れている。たとえば、工場やプラント、交通や、経済、ソーシャルネットワーク等で膨大な動的データが形成されている。工場やプラントのケースでは一般的な石油生産プラットフォームのセンサーでは、毎分10,000回の観測が行われ、ピーク時には100,000 o/mに達したり、モバイルデータのケースではミラノのモバイルユーザーは、1分間に20,000回の通話/SMS/データ接続を行い、毎分20,000回、ピーク時には80,000回に達したり、ソーシャルネットワークの場合は、例えばFacebookでは、2013年5月現在、1分間に300万件の「いいね!」を観測している。

    これらのデータが現れるユースケースでは「最後の10分でタービンのバーリングが振動し始めたときに予想される故障のタイミングは何か?最後の10分間に検出されたように、タービンのバーリングが振動し始めたときの予想故障時間は?」とか「人々がいるところに公共交通機関はあるのか?」とか「話題のトップ10について、誰が議論をしているのか?」等の粒度の細かな様々な課題が生じ、それらに対する解が求められている。

    本ブログでは 以下のページにて、このようなストリームデータを扱うためのリアルタイム分散処理フレームワーク、時系列データの機械学習処理、およびそれらを活用したスマートシティやインダストリー4.0などの応用例について述べる。

    AI学会論文を集めて

    本ブログでは 以下のページにてAAAI、ISWC、ILP、RW等のAI関連の学会論文/予稿集を集めた。

    タイトルとURLをコピーしました