状態空間モデルによる進化と進化を使ったマーケティングへの応用

機械学習技術人工知能技術デジタルトランスフォーメーション技術センサーデータ&IOT ICT技術ストリームデータの処理 ICTインフラ技術確率的生成モデル関係データ学習サポートベクトルマシンスパースモデリング異常検知・変化検知技術時系列データ解析経済とビジネス本ブログのナビ

サマリー

時系列データとは、株価や気温、トラフィック量などの時間の経過に応じて値が変化するデータのことを呼ぶ。この時系列データに対して機械学習を適用することで、大量のデータを学習し、未知のデータに対する予測を行うことで、ビジネスの意思決定やリスク管理などに役立てることができる。

それらの中で代表的な手法としては、“RやPythonを用いた一般的な時系列解析のための実装例“でも述べているARIMA、”Prophetを用いた時系列分析について“で述べているProphet、”LSTMの概要とアルゴリズム及び実装例について“で述べているLSTM、状態空間モデルなどが用いられる。これらの手法は機械学習に基づいた予測手法で、過去の時系列データを学習して未来の予測を行うものとなる。

ここでは岩波データサイエンスシリーズ:「時系列解析−状態空間モデル・因果解析・ビジネス応用」をベースに、この時系列データ解析に対する状態空間モデルの適用について述べる。

状態空間モデルは、時系列データの解析によく使われる統計モデルの一つであり、汎用的な枠組みとなる。状態空間モデルでは、観測される時系列データが、何らかの確率過程によって生成されると考え、その過程を記述する数式モデルを構築する。また、その確率過程を支配する「状態変数」と呼ばれる非観測変数を仮定し、その状態変数の時間的変化を表す遷移モデルと、状態変数から観測される値を生成する観測モデルを考える。

前回はエミュレータの活用と分子シミュレーションの逆問題について述べた。今回は状態空間モデルのマーケティングへの応用について述べる。

イントロダクション

企業が売上を向上させ、サステナブルな存在になるためには、需要サイド(BtoCならば消費者、BtoBならば企業)との接点での活動を高度化させなければいけない。通常、その時点での企業活動をマーケティングと呼ぶ。マーケティングの高度化は、需要サイドの理解なしでは実現できない。

マーケティングの分野では、長い間「動的な構造理解」をなおざりにしてきていた。その理由の一つは、動的な解析に耐えうるデータが存在していなかったことである。しかし、その問題よりも大きな問題は「動的」という考え方に対するある種の認織不足のようなものを指摘しなければならない。多くのマーケティング研究者は「静的な消費者像」を前提にした解析を行えば十分であると考えていたのである。

しかし、消費者の態度や行動が動的に変化しないという考え方に妥当性はなく、動的だと考えモデル化とし知見を獲得しなければ、より深い需要サイド理解につながらない。最近になってその状況に変化が生じ、時間を明示的に意識したマーケティング現象解明の重要性が理解されてきた。ビッグデータ型の消費者行動データ(人x商品・サービスx時点)の蓄積が進み、「時点」を能動的に意識した動的な解析がなされるようになってきた。

市場反応モデル-基本構造

小売業などの企業は、消費者からの反応(購買)を引き出すためにプロモーションと呼ばれる様々な施策を実施する。代表的なものには、値引き、エンド陳列(通路の端に同一の商品を山積みにする陳列方法)などがある。たとえば、小売業の店頭で値引きを実施すれば、値引きをしないときに比べて販売個数が増加する。また、エンド陳列も同様で、通常の売り場で販売したときに比べて販売個数が増加する。

そういった現象をざっくりとした感覚的な評価だけではなく、数値として定量的に評価しようとするのが市場反応分析であり、そこで用いられるモデルを市場反応モデルと呼ぶ。市場反応を評価することは、企業がマーケティング意思決定を高度化するためのイロハであり、通常、企業は下図に示すようなPOSデータを用いてこの種の評価を行う。

以下の式は最も基本的な市場反応モデルとなる。

\[log(y_t)=C+(\alpha+\beta E_t)log(AP_t)+\epsilon_t\quad(1)\]

企業は式(1)のパラメータを推定し、値引きやエンド陳列などのマーケティング施策の効果を評価する。式(1)中、y_t、AP_t、E_tは、第t時点での点数PI(来店客1,000人あたり販売点数)、売値、エンド陳列実施の有無をそれぞれ示す。また、Cはプロモーションに拠らないベースの販売力を、α、βは各販売の販売個数に与える影響度を示す。計量経済学的観点でいえば、αはエンド陳列非実施時の価格弾力性を、α+βはエンド陳列実施時の価格弾力性を示す。価格弾力性とは、価格の1%の変化により目的変数(今回の場合は点数PI)が何%変化するかを示す指標となる。この枠組みにおいてパラメータは時変ではない。なお、εtはノイズ項で、通常、平均0、分散σ²の正規分布に従うものとする。

モデルの拡張 – 進化と深化について

ここではモデルの「進化」と「深化」という考え方について述べる。辞書的に言えば「進化」は環境に応じて変化することであり、「深化」は物事の理解を深めることになる。モデルは人がするものであり、生物の進化のように長い時間をかけて勝手に変化をしていくものではない。その点を踏まえ、ここでは「モデルの進化」を環境変化に対応可能なようにモデルを変化させること(ここでは回帰係数を時変にすることに対応)「モデルの深化」を物事の理解が深まるようにモデルを変化させること(ここでは潜在構造を取り込むことに対応)と捉える。

前述したように、マーケティングでは、市場反応を式(1)に示すように潜在変数間の静的な関係性だけで議論することが多い。しかし、消費者の行動をより深くりかいするためには、当該モデルでは表現しきれない背後に潜む構造はないか、そもそもモデル化の段階で現実にそぐわない家庭がなされていないか、といった観点から絶えず慎重に検討しなければならない。その検討に際してキーとなる考えが、上述のモデルの進化とモデルの深化になる。以降では式(19の試乗反応モデルを基本モデルとし、高度な市場反応メカニズム理解を実現可能にするモデルへ拡張していく。

モデルの拡張 – 回帰係数を時変にする

ここでは、動的な環境変化に対応可能なモデルに拡張するための考え方について述べる。動的な環境変化に対応可能なモデルは、市場反応が時間進展に伴い変化するように拡張すれば実現できる。すなわち、式(1)の回帰係数を時間と共に変化するようにすれば良い。具体的には、式(1)から式(3)((a)→(a*),(b)→(b*),(c)→(c*))のように変化させれば良い。式(3)のTr_t, p_t, α_t, β_tは時変係数であり、それぞれ時点tのトレンド(長期の趨勢)、短期の周期成分、log(Apt)の影響およびEt・log(APt)の影響度を示す。

\begin{eqnarray}log(y_t)&=&\underbrace{C}_{(a)}+(\underbrace{\alpha}_{(b)}+\underbrace{\beta}_{(c)})log(AP_t)+\epsilon_t\quad(2)\\log(y_t)&=&\underbrace{Tr_t+p_t}_{(a*)}+(\underbrace{\alpha_t}_{(b*)}+\underbrace{\beta_t}_{(c*)}E_t)log(AP_t)+\epsilon_t\quad(3)\end{eqnarray}

式(3)は原理的にサンプルサイズより推定すべきパラメータ数が多く、最尤推定のような通常の手法で推定できない。式(3)のモデルを推定可能にするには、時変係数自体のモデル化をしなければならない。時変係数のモデル化には、一般に2つの考え方がある。

パラメータの時間発展のメカニズムを消費者行動理論等で示される構造を採用しモデル化する→理論駆動のアプローチ
時間発展のメカニズムを「少しずつ変化する」という仮定のもとでモデル化する→データ駆動のアプローチ

前述の議論に従えば、上述の「理論駆動のアプローチ」は「進化」と「深化」の2つの次元で同時に、一方で「データ駆動のアプローチ」は「進化」のみの次元で、それぞれ動的拡張するモデルになる。

マーケティング分野には、理論駆動のアプローチに対応できる理論は存在していない。そのため、時変係数xt=(Tr_t, p_t, α_t, β_t)^Tはデータ駆動のアプローチ、かなわち「少しずつ変化する」という仮定のもとでモデル化する(平滑化事前情報アプローチ)ことが多い。

当該アプローチを用いれば、観測モデルがサンプルサイズよりも多い未知パラメータをもつ場合でもモデルを推定できる。ここで問題になるのは「少しずつ変化する」をどのように定式化するのかとなる。通常、「少しずつ変化する」ことは、隣り合う時点間のパラメータの差分が近似的に0になることを期待し、以下の式のように定式化する。

\begin{eqnarray}Tr_t=Tr_{t-1}+v_{1,t}&\quad&v_{1,t}\sim N(0,\tau_1^2)\\p_t=a_1p_{t-1}+a_2p_{t-1}+v_{2,t}&\quad& v_{2,t}\sim N(0,\tau_2^2)\\\alpha_t0\alpha_{t-1}+v_{3,t}&\quad&v_{3,t}\sim N(0,\tau_3^2)\\\beta_t=\beta_{t-1}+v_{4,t}&\quad&v_{4,t}\sim N(0,\tau_4^2)\quad(4)\end{eqnarray}

式(3)を観測モデルとし、式(4)をシステムモデルとして捉え、線形ガウス型の状態空間モデルの枠組みでモデル表現を与えれば、式(1)の最も基本の状態空間モデル化は完遂できる。

モデルの拡張 – 潜在構造を取り込む

次に、消費者行動のより深い理解を実現するために、モデルに潜在構造を取り込むための考え方を示す「潜在構造を取り込むこと」は、今回の事例でいえば、参照価格やプロスペクト理論といった消費者行動理論や認知心理学などで蓄積された知見に基づく、ぐにゃぐにゃ構造(そもそも観測できず構造自体が非線形で動的に変動し、しかもそのメカニズムが人ごとに異なるなどの複雑な構造)をモデルに取り込むことを意味する。

はじめに参照価格をモデル化する、参照価格とは、商品に対する消費者の値頃感を示すものであり、観測できない潜在変数となる。様々な定式化が可能ではあるが、ここでは(5)の定式化を採用する。参照価格はそもそも個人レベルのガイねんであり、本事例のように集計レベルではないが、モデルを深化させるためには有効活用できる。

\[RP_t=aRP_{t-1}+(1-a)AP_{t-1}\quad (0\leq a\leq 1)\quad(5)\]

下図には、式(5)を用いた参照価格の更新メカニズムを示した。

αは参照価格の時間変動に影響するパラメータで、前週までの参照価格が今週の最小価格にどの程度繰越されるかを決める役割を担う。aの値の違いで、参照価格の更新の様相に差が生じる。実際のデータ分析では、aの値の合理的な決め方が問題になるが、最尤法で推定するのが一般的となる。

次に前段で導入した参照価格を用いた価格変数を導入する。式(6)は、参照価格RP_tと実際の売値AP_tとの差により定義した変数となる。式(7),(8)は、APtをRPtが下回っているのか、上回っているかで式(6)を分割して定義した変数となる。Ap_t>RP_tのときをロス・レジーム(売値が参照価格よりも高いので、消費者から見ればロスがある)と、RP_t>AP_tのときをゲイン・レジーム(売値が参照価格よりも低いので、消費者から見ればゲインがある)と呼ぶ。式(7),(8)は説明変数として観測モデル内に同時に取り込むことになる。

\begin{eqnarray}Z_{1,t}&=&\frac{RP_t-AP_t}{100}\quad&(6)&\\Z_{2,t}&=&\begin{cases}\frac{AP_t-RP_t}{100},\quad AP_t\gt RP_tのとき\\0\quad その他\end{cases}\ (ロス変数)\quad&(7)&\\Z_{3,t}&=&\begin{cases}\frac{RP_t-AP_t}{100}\quad RP_t\gt AP_tのとき\\0\quad その他\end{cases}\ (ゲイン変数)\quad&(8)&\end{eqnarray}

上述の価格変数Z_2,t、Z_3,tは下図に示した認知心理学のプロスペクト理論を採用し表現した。

プロスペクト理論は、消費者が得をするときと損をするときとで、その価値の感じ方が異なる事を説明した理論であり、上図でいえば、参照価格(原点)からw円得する点(原点の右側)における接線の傾きを比較すると、損するときの傾きに比べて大きいことで表現される。

当該理論を採用した構造をモデルに取り込めば、マーケティングでいう非対称市場反応が表現できる。式(9)にはZ1,tを、式(11)にはZ2,t、Z3,tを取り込んだモデルをそれぞれ示す。また式(10)、(12)には、それぞれの動的バージョンのモデル式を示す。

\begin{eqnarray}log(y_t)&=&C+(\alpha+\beta E_t)Z_{1,t}+\epsilon_t\quad&(9)&\\log(y_t)&=&Tr_t+p_t+(\alpha_t+\beta_tE_t)Z_{1,t}+\epsilon_t\quad&(10)\\log(y_t)&=&C+(\alpha_1+\beta_tE_t)Z_{2,t}+(\alpha_2+\beta_2E_t)Z_{3,t}+\epsilon_t\quad&(11)&\\log(y_t)&=&Tr_t+p_t+(\alpha_{1,t}+\beta_{1,t}E_t)Z_{2,t}+(\alpha_{2,t}+\beta_{2,t}E_t)Z_{3,t}+\epsilon_t\quad&(12)&\end{eqnarray}

ここまでで、潜在構造をモデル内にとの混む考え方について述べた。具体的には、モデルの説明変数の構造式を式(1)のlog(AP_t)から、潜在変数である参考価格を考慮し、式(9)のZ_1,tの価格変数へ発展させ、最終的にプロスペクト理論を採用することで式(11)のZ_2,t、Z_3,tまで進展させた。

潜在構造を取り込む手続きは、「モデルの深化」に対応している。モデルの深化は、モデル化する対象の問題設定に依存し、その周辺に対する知識・知見がなければ実現できない。その意味では難しいが、モデルの深化は需要サイドの理解にとって必須のプロセスとなる。

ここで示したアプローチとは別に、(化学的なアプローチとしては批判される可能性はあるものの)実務的な経験やデータを眺めてこんな構造があるのではないかといった非常にナイーブな考え方からもモデルを深化できる。要は「こんな構造がデータの背後に潜んでいるのではないか?」といった我々のある種の期待をモデルとして表現すればよい。ただし、仮定した潜在構造の妥当性は、モデル化し、そのモデルを推定した上で、他の候補モデルの推定結果と相対的に比較する事で、評価しなければならない。

下図に、前述した静的市場反応モデルから進化と深化を繰り返しモデルを発展させるプロセスを示した。

最終形のモデル⑥は、以下のように特徴を整理できる。

yt, AptおよびEtは観測変数
Rptは潜在変数であり、式(5)の漸化式に基づき構成し、Z1,t, Z2,t, Z3,tはAptとRPtを用いて、式(6)、式(7)、式(8)で定める。
Tr_t, p_t, α_1,t, β_1,t, α_2,t, β_2,tは状態変数であり、それぞれ式($)に準じたシステムモデルに従う。
式(12)が最終形の観測モデル

解析事例

最後に、前述のモデルの推定結果を示す。図5に示した6つのモデルのAIC値を列挙すると①578.12、②663.44、③583.32、④570.61、⑤554.00、⑥531.22となっており、モデル⑥が選択される。モデル⑥は、反応係数が時変であり、参考価格を考慮し、さらには非対称市場反応を考慮したモデルとなる。以降は⑥の推定結果の概要となる。

式(5)のaは0.95と推定されている。この結果は、前週の売り上げによって参考価格が更新される場合は5%である事を意味する。下図に、売値と推定された参考価格の推移を示す。

データ期間後半に着目すると、参照価格は1200円程度で推移している。通常売値が1500円程度であることを考えると、消費者の値頃感は非常に低いレベルにある。当該企業(小売、メーカー)は、その状況下でも大きな値引きを繰り返している。現状の価格戦略を繰り返すと当該商品の参照価格のさらなる低下をまねき、結果的に今よりも深い値引きをしない限り売り上げが上がらない状況に陥る。

下図には、ロス/ゲインレジームとエンド陳列実施の有無でサンプルを分類し、グループごとに時変係数(平滑化推定量)の推移を示した。

たとえば、ロスレジーム(エンド陳列非実施)の反応係数α_1,tとゲインレジーム(エンド陳列実施)の反応係数α_2,t+β_2,tの推移に注目すると、α_1,t, α_2,t+β_2,tともその効果が低下傾向だとわかる。この結果は、定番の売り場であろうとエンド陳列実施事であろうと、過去と同じだけ値引きしても売れなくなっていることを示す。当該知見はあくまでも一例でしかないが、こういった知見はモデルを進化&深化させなければ得られず、当該モデル化のアプローチの有用性を示唆する。

まとめ

ここまでで、マーケティング分野で状態空間モデルを活用し、高次元情報を中卒するためにはどうすればよいかについてイメージを保つための議論を進めた。ここでの事例はPOSデータを用いたものであるが、昨今より重要度の増している個人レベルの動的行動の解析にも状態空間モデルを活用できる。ただし個人レベルの行動の「ぐにゃぐにゃ度」は、今回の事例よりも間違いなく高く、前述のモデルの進化&深化の考え方が本事例よりも威力を発揮するはずである。

次回はVARモデルによる因果関係の推論として欠測の補間とDF、ADF検定について述べる。