DX (Digital Transformation)技術は、デジタル技術を駆使してビジネスプロセスを革新し、競争優位を築くための重要な要素であり、ここでは、以下のテーマを詳しく解説している。目次の項目をクリックすると該当サマリーにジャンプする。
DX技術
DX(digital transformation)技術について
近年注目を浴びているDX(Digital Transformation)。企業の中にある情報のうち8割以上が電子的に扱うことが困難な、非構造情報あるいは非電子情報であると言われている。それらを十分に活用することができれば大きな効果が得られることが期待されるが、非構造情報あるいは非電子情報の電子化は非常に困難であり、戦略性を持ったアプローチが必要とされる。
DXの対象となる情報としては、自然言語処理技術にて処理されるテキスト情報、深層学習等で処理される画像情報、HMM等の確率生成モデル等で処理される音声情報、センサー等のIOTで生成される情報、そしてSemantic Webやオントロジー技術で処理される知識情報がある。
これらの処理については、以下にそれらについて述べているが、さまざまなノウハウがあり、また電子化された情報(特徴量等)は、関係性を持ち知識情報を核として組み合わされて多様な価値を生む。
このDXを検討する際の一つのアプローチとして以下のようなステップがある。
- 目的の明確化(課題の分析): 現在の業務フローの分析と課題の分析を行う。初期の段階では課題が明確に抽出できないケースも多くあるが、その場合は既存分析手法(KPI、OKR等)を用いて仮説を立てて、対象業務を選択しその業務の流れをアクター(登場人物)、オブジェクト(ドキュメントやその他の情報)、システムの3つの軸をベースに見える化する。
- 対象情報の整理/分析: 1で選んだ領域に関連するデータの収集/分析の量と所在場所、属性(どのようなタイプの情報なのか、電子化されているのか等)をリストアップする。電子化が必要なものに対しては電子化の手段を調査/決定する。この時解決したい課題に基づいた情報の粒度(例:文書そのものか、パラグラフか、あるいは単文か等)についても検討する。この時点で1の目的と照らし合わせて課題解決に必要な情報が揃っているのかどうかをチェックする。
- 一次検証: 情報を対象とする課題の場合は、まず「情報を見つける」ことが最初の課題となる。そこでオープンソースの検索エンジンを用いて(後述のFESSやElasticSearch等)を用いて、2でリストアップした情報を元に検索システムを構築し、1の目的に対して必要な情報が基本的な検索で得られるのかどうかを検証する。これらの検証は予め目標値(インプットとアウトプットのペア)を想定して評価し、それらがどの程度得られるのか、また答えが得られないのは何が不足しているかを分析して、必要なデータ(2)、及び目的/目標値(1)を修正する。
- 二次検証: 3で得られない情報は、素の検索素材だけでは得られないということであり、それらを生成する為に機械学習/人工知能技術の中から適切な技術を選択して情報の加工/生成を行う。この時、目標値は3で得られた課題(素の検索素材だけでは得られない情報等)を定量化して評価を行う。ここで再度1の目的とのすり合わせも実施し、最終的な費用対効果を見積もる。
- 本番システム構築:4のステップまでで、効果が明確に得られる事が確認できたら、本番システムの構築(ロバスト性、スケール検討、メンテナンス性等を含む)を行う。
上記のステップに必要な参考情報を以下に示す。
課題設定と定量化
問題解決手法と思考法及び実験計画。機械学習では、PDCAやKPIなどのフレームワークを用いて目標を定量化することが重要である。問題が不明確な場合は、演繹法やアブダクション法などで仮説を立て、確証バイアスを避けつつ検証し、フェルミ推定で定量化する。ここでは、問題解決手法や思考法、実験計画について解説している。
DX活用に向けた人工知能技術の具体的な適用事例
DXの事例としての人工知能技術。人工知能技術は、人間の知能や思考を模倣して、コンピューターやロボットに知的作業を行わせる技術であり、機械学習、深層学習、自然言語処理、画像認識などが含まれる。近年急速に発展し、自動運転車や医療、金融、マーケティングなどさまざまな分野で利用されている。ここでは、DX(デジタルトランスフォーメーション)への人工知能技術の適用例を紹介する。
ICTフレームワークの適用
Web技術について
Web技術について。Web技術は、機械学習やAI、DXを支えるプラットフォーム。ここでは、インターネット技術、HTTP、Webサーバー、ブラウザ、JavaScriptやReactなどのプログラミング、MAMPやCMS(MediaWiki、WordPress)、検索プラットフォーム(Fess、ElasticSearch)の実装と応用例について解説する。
データベース技術について
データベース技術。データベースは、情報を整理し、検索や蓄積を容易にするためのシステムで、データベース管理システムを使用することが多い。これにより、独自実装より少ない工数でデータ操作が可能になり、膨大なデータを扱う現代の情報システムでは不可欠。利点としては、汎用的なデータ構造を活用でき、データの統一性やバックアップ機能を利用できることが挙げられる。ここでは、データベースに関する様々な技術を紹介する。
検索技術について
検索技術について。情報は単に集めるだけでは意味がなく、創造的な活動を行うためには「集める」「探す」「見つける」「眺める」「気づく」というサイクルが必要。この中で「探す」技術、つまり検索技術について解説する。
チャットボットと質疑応答技術について
チャットボットと質疑応答技術。チャットボット技術は、様々なビジネス分野で汎用的なユーザーインターフェースとして利用されており、多くの企業が参入している領域である。質疑応答技術に基づき、単なるユーザーインターフェース技術に留まらず、自然言語処理技術や推論技術、深層学習、強化学習、オンライン学習などの人工知能や機械学習技術を組み合わせた高度な技術を活用している。しかし、現時点では多くのチャットボットは、これらを駆使せず、ルールベースのシンプルなものにとどまっている。ここでは、チャットボットと質疑応答技術に関して、成り立ちからビジネス的側面、最新のアプローチを含めた技術的概要、さらには実際に利用可能な具体的な実装方法まで、さまざまなトピックについて述べている。
Visualization & UX
ユーザーインターフェースとデータビジュアライゼーション技術。データ処理は、構造をビジュアライゼーションすることで価値を生む行為であり、多角的な視点と解釈が可能。それを可視化するには工夫されたユーザーインターフェースが必要。ここでは、ISWCなどの学会論文を基に、多様なUIの事例を紹介する。
ワークフロー&サービス
ワークフロー&サービス技術。各種学会で発表されたサービスプラットフォーム、ワークフロー分析、実ビジネスへの応用に関する論文をまとめ、医療、法律、製造業、科学などのビジネスドメインにおけるセマンティックウェブを活用したサービスプラットフォームについて述べている。
ストリームデータ技術
データストリーム(時系列データ)の機械学習とシステムアーキテクチャ。現代社会は動的データで溢れており、工場、プラント、交通、経済、ソーシャルネットワークなどの分野で膨大なデータが生成されている。例えば、工場のセンサーやモバイルデータ、ソーシャルネットワークでは、毎分数万回の観測が行われ、様々なユースケースでリアルタイムのデータ分析が求められている。具体的には、タービンの故障予測や公共交通機関の位置、人々の議論を追跡するなど、細かな問題への解決策が必要とされる。本書では、これらのストリームデータを扱うリアルタイム分散処理フレームワークや時系列データの機械学習処理、またそれらを活用したスマートシティやインダストリー4.0の応用例について述べる。
非構造情報のデータ(電子)化
自然言語処理技術
自然言語処理技術。言葉は人間同士のコミュニケーション手段であり、人が自然に身につけるものだが、コンピューターにとって扱うのは非常に難しい。自然言語処理は、その言葉をコンピューターで扱う研究分野で、初期は規則に基づいていたが、1990年代後半からは実際の言語データを用いた統計的手法が主流となった。ここでは、自然言語の哲学・言語学・数学的側面を概観し、自然言語処理技術全般、言葉の類似性、さらにコンピューターで利用するためのツールとプログラミング実装について解説し、実際のタスクへの応用方法を述べている。
画像情報処理技術
画像情報処理技術。現代のインターネット技術やスマートフォンの発展により、膨大な画像がWeb上に存在し、それらから新たな価値を生み出すために画像認識技術が必要とされている。この技術は、画像固有の制約やパターン認識、機械学習、さらに応用分野の専門知識が求められ、扱う領域が広範囲にわたる。また、深層学習の成功により、画像認識に関する研究が急増し、その全体を把握することが難しくなっている。ここでは、画像情報処理技術の理論とアルゴリズム、Python/Kerasを使用した深層学習の実践、スパースモデルや確率生成モデルを用いたアプローチについて述べている。
音声認識技術
音声認識技術。機械学習技術は、信号処理の領域で重要な役割を果たしており、特に時間軸で変化する一次元データであるセンサーデータや音声信号に適用される。音声信号認識には、深層学習をはじめとするさまざまな機械学習技術が使用される。ここでは、音声認識技術に関して、自然言語と音声のメカニズム、AD変換、フーリエ変換、動的計画法(DP法)、隠れマルコフモデル(HMM)、深層学習などを用いた話者適応、話者認識、耐雑音音声認識などの応用について述べている。
地理空間情報処理
地理空間情報処理技術。地理空間情報は、位置情報や位置と結びついた情報を指し、行政で扱う情報の80%は位置情報と関連しているとされる。位置情報を活用することで、地図上に情報をプロットして分布を把握したり、GPSデータを用いて目的地へ誘導したり、軌跡を追跡することができる。この情報を基に過去、現在、未来の出来事を元にサービスを提供することも可能である。地理空間情報を活用することで、科学的発見やビジネス展開、社会問題の解決が進む。具体的な活用方法として、QGISやR、機械学習ツール、ベイズモデルとの組み合わせについて述べられている。
センサーデータ&IOT
センサーデータ&IOT技術。センサー情報の活用はIoT技術の中心であり、ここでは時間的に変化する1次元のデータに焦点を当てている。IoTのアプローチには、個別にセンサーを設定して測定対象を詳細に解析する方法と、複数のセンサーを使って異常検知を行う方法がある。具体的な技術として、IoT規格(WoTなど)、時系列データの統計処理、隠れマルコフモデルを使った確率的アプローチ、劣モジュラ最適化を用いたセンサー配置、BLEなどのハードウェア制御、スマートシティ関連の知見について述べられている。
異常検知と変化検知
異常検知と変化検知技術。機械学習による異常検知は、通常の状況から逸脱した異常を検出する技術であり、変化検知は状況の変化を検出する技術である。これらは、製造ラインの故障やネットワーク攻撃、金融取引の不正など、異常な振る舞いを検出するために使用される。異常検知・変化検知の技術には、ホテリングのT2法、ベイズ法、近傍法、混合分布モデル、サポートベクトルマシン、ガウス過程回帰、疎構造学習などがあり、これらのアプローチが述べられている。
電子化されたデータの知識情報との連携
Semantic Web技術
セマンティックウェブ技術。セマンティックウェブ技術は、Webページの意味を扱う標準やツールを開発し、WWWを「ドキュメントの網」から「データの網」へ進化させるプロジェクトである。DIKWピラミッドのInformationやKnowledgeを、オントロジーやRDFといったフレームワークで表現し、DXやAIのタスクに活用する。ここでは、セマンティックウェブ技術やオントロジー技術、さらにISWC(国際セマンティックウェブ会議)の学会論文について論じる。
知識データとその活用
知識情報処理技術。知識を情報としてどのように扱うかは人工知能技術の中心課題であり、コンピューターの発明以来、様々な方法が検討されてきた。ここでは、知識を自然言語からコンピューターが処理可能な情報に変換する方法を論じ、知識の定義、セマンティックウェブ技術やオントロジー、数理論理学に基づく述語論理、Prologを用いた論理プログラミング、そして解集合プログラミングとその応用について解説している。
オントロジー技術
オントロジー技術。オントロジーは、情報科学ではデータを体系化し構造化するための形式的モデルであり、概念や事物、属性、関係を共有可能な形式で表現する。これにより、情報検索、データベース設計、知識管理、自然言語処理、人工知能、セマンティックウェブなどで、データの一貫性や相互運用性を向上させる。さらに、特定の分野に特化したドメイン固有オントロジーも、情報共有や統合に活用される。ここでは、情報工学の視点からオントロジーの活用について論じる。