リアルなSimCityの夢

機械学習技術 人工知能技術 デジタルトランスフォーメーション技術 確率的生成モデル 時系列データ解析 サポートベクトルマシン スパースモデリング 異常検知・変化検知技術 関係データ学習 本ブログのナビ シミュレーションと機械学習
サマリー

岩波データサイエンスシリーズ「時系列解析−状態空間モデル・因果解析・ビジネス応用」より。前回はタンパク質の3次元形状(ミスフォールディング)のシミュレーションと機械学習による解析について述べた。今回はリアルなSimCityの夢について述べる。

問題解決ツールとしてのSimCity

SimCityは、1989年に公開されて以来、今日に至るまでロングヒットを続けている都市開発シミュレーションゲームである。

このゲームは市長になって仮想のまちをつくると言うゲームで発電所や役場をはじめ、年に必要な基盤施設の建設を行うなど、実世界に通じるリアリティがある。ある程度、都市が成長してくると、住民の満足度や災害への対応等、対応しなくてはならない問題の複雑度が増し、ゲームの難易度が高まってくる。

SimCityはエンターテイメントを目的としたゲームだが、実世界のリアルなデータ、リアルなモデルに基づいたシミュレータがSimCityのようなインターフェースとして利用できれば、専門家でなくてもマーケティングや政策の施策計画・立案に広く、かつ深く関与できるようになる。

リアルなSimCityには大きく2つの社会的なニーズがある。一つが、意思決定支援で、テクノロジーの発達や少子高齢化、法令改正などによる社会変化が大きいこんにちは、先先見しずらい時代であるが、たとえば不動産価格を例にすると、自動運転技術がレベル4で普及した場合に、駅前の家賃が高く、郊外の家賃が低いと言うこれまでの常識通りにいかなくなる可能性出てくるなどの変化が起こる。

将来起こりうる可能性やリスクを定量的に示すには、専門的な人材やノウハウなどが必要となり、多大なコストを要する。簡易的に任意のシナリオを設定し、予測可能なプラットフォームが存在する事で、企業や行政が時代の変化に柔軟に対応していく助けとなる。

もう一つが、リアリティの追求となる。過去に千葉県浦安市主催の宿泊型防災研修「すごい防災訓練」において、後述する世帯単位の属性推定データが活用された。参加した中学生に深度7の自信が起きた場合のリアルな人口分布や被害状況を示す事で、緊張感を持って自身の役割や優先事項を考察・行動する体験をしてもらうことができた。

現代はデータに溢れ、大規模な計算に必要不可欠なコンピューター・リソースや、計算プログラムの作成に有用なソフトウェアも普及している。これらを活用した一形態がリアルなSimCityとなる。

リアルなSimCityの実現に向けた課題

SimCityとは、マルチエージェント・シミュレータであるといえる。複数のエージェントに同時進行的な各々のルールのもと、相互に影響を及ぼしながら都市経営をシミュレーションすることができる。SimCityの重要な概念である住民の満足度は、まさにこのプロセスを経て計算される。

ここでいうエージェントとは住民や車が該当する。たとえば、住民の場合、住所や所得、満足度といった属性が一人一人に存在する。満足度に沿って行動が決定され、満足度が低い場合は「転出」が起きる。一連のプロセスがエージェントの行動や属性として逐次可視化されるため、ゲームの因果関係を直感的に把握できる。

SimCityがシミュレータとして優れている点は、当然のことではあるが、ゲーム進行に影響を及ぼす属性(要素)やその関係性が単純ななルールとしてすべて把握できている(=定義されている)ことにある。それ故、SimCityでは各エージェントの行動の総和を階層的に捉える事が可能になり、人口移動や公害問題、渋滞などのさまざまな社会現象をゲーム上で表現することに成功している。

しかしながら、現実世界では一概に説明する事ができない現象ばかりであり、例えば購買行動という個人の行動一つにとっても、お店までの距離や価格、ブランド、取扱品目など、無数の属性が考えられる。完全に現実社会を再現する万能ツールを作るためには、この世界をまるごとデジタルコピーする必要があり、現実的ではない。

そのため、上述の「転出」のように、シミュレータで表現したい現象を絞り、住民の「満足度」のように、現象を引き起こす実際には観測が困難な要因を変数として仮想的に導くことが考えられる。それには包括的に観測可能なデータ群から統計的に求めた主成分などを用いる場合や、ソースが存在しない場合には公理や家庭から導いた仮説演繹的な方法に基づく場合なとが考えられる。

リアルなSimCityを実現するための技術

リアルなSimCityの実現のために必要な要素の一つとして、エージェントデータの作成がある。ここでは住民をエージェントとした場合の属性推定について述べる。

住民に該当する属性とは、家族構成や年齢、収入といった消費行動に影響があると考えられる情報となる。たとえば、家族構成が単独世帯の場合と、親子からなる世帯では、ライフスタイルや世帯支出構成に差があることは想像に難くない。これらの情報は基礎情報であるが、一般的に個人情報に該当するデータであり、プライバシー保護の観点から取り扱いが難しいデータとなる。

そこで、気象学において地域気候予測に用いられるダウンスケーリングにヒントを得て、統計調査データをもとに住民属性の推定を行った。国勢調査をはじめとする町丁・字単位などに集計された人口統計から推移確立を生成する。

たとえば、夫婦世帯数は居住面積別に人口統計上で集計されており、世帯単位の居住面積はGISを用いて基盤地図情報(国土地理院)などの地図データから取得・推定可能となる。さらに世帯主年齢別に集計された夫婦世帯数を組み合わせた推定行列から、世帯単位の世帯類型や世帯主年齢等の属性を確立的に推定する事ができる。下図はそのようにして推定した高齢者の居住分布となる。

おわりに

リアルなSimCityの実現に向けた取り組みはまだエージェントのパラメータ推定に留まっており、今後の流れとしては、エージェントの行動結果に該当する購買情報や訪問情報などの行動実績データについても、人口動態属性との関係性をもとに推定していくことが考えられる。

エージェントの情報を取得するには、擬似的に推定する内容もあるが、企業の持つ承認済み会員情報やモニター情報をもちいる方法も考えられる。その一つとして、フレームワークス物流オープンデータコンテストについて述べる。このコンテストでは、実際の業務において取得された配送トラックや倉庫内スタッフの移動軌跡・行動履歴データを、ローデータに近い状態で誰でもアクセスできる形で公開されている。またそれらに世帯単位属性推定データを組み合わせた分析も行われている。

SimCityの初期版はMicropolisという名称でDon Hopkinsのホームページからオープンソースとして公開もされている。

次回はエミュレータの活用と分子シミュレーションの逆問題について述べる。

コメント

  1. […] リアルなSimCityの夢 […]

  2. […] 岩波データサイエンスシリーズ「時系列解析−状態空間モデル・因果解析・ビジネス応用」より。前回はリアルなSimCityの夢について述べた。今回はエミュレータの活用と分子シミュレーションの逆問題について述べる。 […]

  3. […] エミュレーションと機械学習を用いた現実世界へのSimCityの適用 | Deus Ex Machina より: 2022年6月15日 3:53 AM […]

タイトルとURLをコピーしました