夢と脳と機械学習 夢理論から夢のデータサイエンスへ

ウェブ技術 デジタルトランスフォーメーション技術 人工知能技術 自然言語処理技術 知識情報処理技術 セマンティックウェブ技術 深層学習技術 オンライン学習&強化学習技術 チャットボットと質疑応答技術 ユーザーインターフェース技術 推論技術 禅と人工知能 life tips&雑記 テクノロジー雑記 本ブログのナビ
サマリー

岩波データサイエンスVol.6より。

寝ているときにみる夢とデータサイエンスの間には、一見何の関係もないように見えるが、夢は、機械学習や脳理論の発展においてアイデアの源泉の一つであった。また、最近では、機械学習を用いたデータ解析 により、寝ているときの脳活動パターンから夢の内容を解析(デコード)することが可能となってきた。ここでは、夢のデコーディングに至る夢研究の足跡についてたどる。

夢の生理学

夢とは、ここではざっくり「睡眠中に生じる意識現象」を指すものとする。ここでの意識とは、Tononiの統合意識理論(Integrated Information Theory,IIT)をはじめ、脳やシステムの状態により意識を定義・定量化する試みはあるが、少なくとも現時点では、その本人の主観報告を意識状態の”ground truth”として扱わざるを得ない。夢の内容も本人にしか知ることができず、その記憶もごく短時間で消えてしまうため、夢を科学的な研究の対象とするのは難しいとかんがえられてきた。1953年に睡眠中の急速眼球運動(rapid eye movement, REM)の出現が発見されるまでは、夢研究は、主観報告をもとにした精神分析学的アプローチが主流をなしていた。

睡眠中の脳波を計測すると、眠りの深さに応じて、脳波の周波数や振幅、波形などが変化する。急速な眼球運動をともなう睡眠状態(REM睡眠)が発見されると、統一的な睡眠ステージの分類のために、脳波、眼球運動、筋電図を同時記録するポリソムノグラム(polysomnogram)の記録が必須とされるようになった。これにより、覚醒・睡眠状態は、覚醒、non-REM睡眠、REM睡眠に分類され、non-REM睡眠はさらに4ステージに分類されるようになった。

1957年の論文でDementとKleitmanは、被験者を、non-REM睡眠とREM睡眠のそれぞれから覚醒させ、夢体験の有無を尋ねる実験の結果から、夢はREM睡眠でのみ生じると結論した。しかし、その後の研究から頻度は比較的少ないものの、non-REM睡眠からも夢の報告が得られることがわかっており、近年ではTononiを始め多くの研究者が、睡眠ステージと夢は別々に扱うべき事象であると考えている。しかし、現代においても「夢=REM睡眠」というドグマは根強く残っている。

夢との関連で興味深いのが、1994年にWilsonらがラットの海馬で発見した神経活動の「リプレー」となる。これは、動物が課題を遂行した後の睡眠または安静状態で、課題中と類似の神経活動が再生される現象で、記憶の固定化などに寄与していると考えられている。

これを夢と呼べるのかと考えると、ラットの主観報告はそもそも困難なので、意識現象が生じているかを確認することはできない。一方、意識に上がらない形で、脳が自発的に活動して記憶の固定化などの機能を遂行していると考えても何の不都合もない。また、リプレーはnon-REM睡眠中によく観察される。したがって、夢=REM睡眠というドグマとも整合しない。一般向けの解説で「夢=リプレー」とされることもあるが、これも一筋縄ではいかない問題を抱えている。

夢の機能とフロイトの夢理論

夢は何のために見るのか?夢の機能や目的について議論するとき、フロイトの夢理論の影響を無視することはできない。フロイトは、意識的にアクセスできない思考や感情(「無意識」)が我々の行動を導いているという理論をもとに精神分析学を展開した。夢は抑圧された無意識の願望や意図の暗号的な表出であり、その意味を読み解くことで、心の問題に対処することができると考えた。しかし、科学者の多くは、実証的根拠がなく反証不可能な理論としてこの説をさけてきた。

Hobsonらは、1977年に夢の「活性化-合成仮説」を提唱して以来、フロイトの夢理論を非科学的で無価値なものとして批判してきた。活性化-合成仮説によれば、REM睡眠中に生じる脳幹からの信号がランダムに大脳皮質・辺縁系を活性化し、結果として辻褄が合うように夢のシナリオが合成される。Hobsonは、夢の内容はREM睡眠に伴う無意味な随伴現象に過ぎないとしている。

一方、神経学者であり精神分析家でもあるSolmsは、non-REM睡眠中でも夢報告が得られることや夢見と脳幹の活動の関係は明確でないことを挙げ、REM睡眠と夢を同一視するHobsonを批判している。夢見中の脳活動はむしろ、情動や知覚に関連する大脳皮質・辺縁系の活性化と思考や行動を制御する前頭前野の活動低下によって特徴づけられる。

また彼自身の研究によると、脳損傷により完全に夢を見なくなる症状は、前頭葉と頭頂葉の一部に損傷がある場合に限られ、脳幹の損傷では起こり得ない。夢見中に情動やイメージと関連する部位が活性化し、意識的な思考や判断と関連する部位の活動が低下することは、フロイトの夢理論と少なくとも大まかなレベルでは整合するのではないか、とSolmsは主張している。

フロイトの夢理論を文字通り受け取るかは別として、夢が何らかの適応的な意義をもつという認織は広く共有されており、危機的な状況に対するシミュレーション、記憶の定着と整理、情動反応の中和などさまざまな機能が提案されている。Hobsonも、夢の内容にこそフロイトが想定するような意味を見出さないが、後述するように近年では、夢を生み出す脳のプロセスがもつ適応的機能について仮説を提唱している。

夢と「生成」モデル

2015年、Googleの研究者が深層ニューラルネットワーク(deep neural network,DNN)を使って悪夢のような画像を生成される技術”Google Deep Dream”を公開した。これは睡眠中に見る夢とは直接関係がない。DNNの特定の人工ニューロンの活動が高くなるように画素値を少しずつ変化させていくことで、不気味な画像が生成される。Deep Dreamで用いられているDNNは前向き結合のみのフィードフォワードネットワークだが、最近ではGenerative Adversrial Network(GAN)など、画像や音声の生成を目的としたネットワークの開発が盛んとなっている。一方、夢は外界からの感覚入力がない状態での脳の自発活動により「生成」される。ニューラルネットワークが入力パターンの認織ではなく生成を行うところが夢を連想させるのは自然な方向性となる。

Hintonらが1995年に提案した”Wake-Sleep”アルゴリズムは、このような「夢=生成」アナロジーを明示的に用いている。ここでは入力層から出力層への「認織」結合と出力層から入力層への「生成」結合を持つ確率的ネットワークを仮定する。

「覚醒時」は入力信号を用いて結合ウェイトの学習が行われるが、「睡眠時」には出力層のランダムな活動パターンから生成モデルを通して仮想的な入力パターン(「夢」)が生成され、それを用いて学習が行われる。このような「夢」を用いたオフライン学習により効率的な表現が獲得され、「覚醒時」の認織が向上する。このアイデアの背後にHbsonの活性化=合成仮説があるのは明らかであろう。

最近では、Hobson自身がFristonと共同で、機械学習モデルを用いた夢の機能の定式化を試みている。Fristonは脳イメージングの解析手法の開発で著名だが、一方で、上記のHintonらの研究でも用いられる生成モデルと自由エネルギー最小化原理をベースにした知覚的推論や学習に関する「ベイズ脳」理論を展開している。2014年の論文でHobsonとFristonは、夢は「バーチャルリアリティ」を生成するもので、それを用いた学習により、脳が持つ外界のモデルの複雑性が調整され、覚醒時の予測が効率的に行えるようになると仮定し、夢に関するさまざまな生理学的現象との関係を議論している。

夢内容と脳

ここまでの議論では、夢が睡眠中の脳活動と対応することを暗黙に仮定してきた。しかし、この過程は必ずしも自明ではない。夢の経験は現在系で語ることはできず、覚醒後の階層という形でしか示すことができない。このため、夢の経験が本当に睡眠中に起こっているのか、あるいは覚醒後に作り上げたものなのかという基本的な点についても懐疑論が提示されている。

睡眠中に夢を見ていることをサポートする証拠の一つとして、睡眠行動障害の例を挙げることができる。REM睡眠中には、抗重力筋の脱力が起きるために、本来ならば身動きが取れない状態になる。しかし、REM睡眠の中枢である脳幹付近に異常が生じ、脱力システムが正常に動かなくなると、夢で見たことをそのまま行動に移してしまうという症状が起きることがある(REM睡眠行動障害)。これとよく似た行動に、non-REM睡眠中に生じる睡眠遊行(夢遊病)があるが、睡眠遊行では夢の記憶がないことが多いと言われている。

しかし、この問題に決着をつけるもっともストレートな方法は、睡眠中の脳活動パターンから覚醒後の夢報告の内容を推測することができるかを調べることとなる。

ブレイン・コーディング

ATRの神谷らは、ヒトの脳活動のパターンから心の中のイメージを解読する方法を開発している。この研究は機能的磁気共鳴画像(fMRI)によるヒトの脳活動計測に機械学習を用いて解析するという発想からきている。

通常のfMRI研究では、感覚刺激や課題の違いによってfMRIの信号強度に差が出る脳部位を同定するという手法が採られる。fMRI画像の個々の画素(ボクセル)強度を、刺激や課題の変数とその係数からなる線形モデルによって回帰し、係数が統計的に有意にゼロと異なる場合にその画像に「色をつける」という手続きを全画素について繰り返す(general linear model,GLM)。一つの脳画像に数十万画素あるので、ナイーブに統計検定するとノイズだけのデータでも数十万個の画素に色がついてしまい偽陽性が出やすいなど、この手法にはさまざまな問題がある。

それらの中でも、個々のボクセル値がアンケートの回答のように扱われ、心理学の「刺激(S)→反応(R)」図式を無理やり脳画像解析に当てはめたような方法論には、脳はそもそもネットワークとして機能しているのだから、ボクセル値の「パターン」を使ったもっと自由なモデリングができるはずで、強く違和感を感じる。

これに対して、fMRIの基本的な解析であるGLMではなく、Haxbyらが行った、顔や家などの数種類の物体画像を見た時のfMRI計測において、同じ物体に対するボクセルパターンの相関が、異なる物体に対するボクセルパターンの相関よりも高いことを示した2001年の論文を元に、多数のボクセルのパターンに含まれる情報を機械学習で抽出するというアプローチを取る。

これにより、刺激画像の線の方位(縦、横、斜めなど)のようにfMRIボクセルより細かな脳構造(コラム構造)に表現されていると考えられる情報を、ボクセル値のわずかな変化のパターンから解読する。機械学習の手法としてはサポートベクトルマシン(SVM)を当初使っていたが、近年では入力となるボクセルの次元に強いスパース性を導入したベイズ線形モデルが使われている。一般に脳画像データは、特徴(ボクセル)数が観測数(脳画像の枚数、あるいは実験ブロック数)に比べて非常に多いので、正則化や次元削減などの工夫が必要となる。

このアプローチで、脳画像解析の手法として「デコーディング」ということが用いられてきたが、現在では「ブレイン・デコーディング」という表現が一般に用いられるようになっている。これは、脳活動パターンを、刺激や心身の状態を表現する「符号(コード)」とみなす情報論的な考え方に基づいている。

これは、脳がボクセルを情報の単位として扱っていると考えられないので、脳自体がこのコードを使っているということを主張するものではなく、あくまでも外部観察者の視点で、特定の部位の脳計測信号パターンが刺激や心身の状態と情報として変換可能かどうかに注目する方法論となる。

また神谷らは、主観的な心理状態を解読する方法も提案している。まず刺激画像を見せた時の脳活動パターンを使って機械学習モデル(デコーダ)をトレーニングしておく。そのデコーダを用いて、主観的な状態、たとえば、ある画像を心の中でイメージしている状態の脳活動を解読することで、イメージしている図形を予測することができる。

これは機械学習における「転移学習」の一種とみなすことができる。主観的な状態の脳活動でデコードをトレーニングしてもよいが、そのとき被験者が実際に何をやっているのかを客観的に確認することはできない。刺激画像に対する脳活動を用いることで客観性をある程度確保することができ、この方法は「ニューラル・マインド・リーディング」と呼ばれる。

夢の脳計測実験

ニューラル・マインド・リーディングが可能なのは、心の中で画像を思い描いている時には、実際に画像を見ている時と類似した脳活動パターンが生じているからで、夢の視覚的内容も覚醒時の近く内容と類似した脳活動パターンで表現されているとすれば、同じ方法でデコードできるはずである。

しかしながら、この実験を行うには、さまざまな困難がある。研究上の課題の一つは、多数の夢データをいかに収集するかでREM睡眠は通常睡眠から1時間以上経ってから現れるので、REM睡眠を対象とすることは、データ収集の観点から効率が良くない(MRI装置は1時間あたり10万円の使用料がかかる)。そこで、初期の研究では入眠時から数分以内に見る夢を対象とした。これは睡眠ステージ1あるいはステージ2に相当する。睡眠ステージ1においては急速眼球運動は見られないが、脳波はREM睡眠と酷似しており、夢報告が比較的高頻度で現れる。

実際に被験者にMRI装置内で脳波測定用の電極キャップを装着した状態で眠ってもらい、脳波から睡眠状態をリアルタイムに判定しながらfMRI計測を行う。脳波は、睡眠ステージを判読する標準的手法だが、それだけでは夢の内容はわからない。

一方、fMRI画像を目で見るだけでは、寝ているか覚醒しているかすら判別できない。夢見と関連があると知られている睡眠脳波が生じたタイミングで被験者を覚醒させ(睡眠開始から2〜3分後)、直前まで見ていた夢の内容を自由に報告させた(約30秒)。報告後再び被験者に眠ってもらうという手続きを繰り返した。各被験者について少なくとも200回の視覚的夢宝庫くが得られるまでこの手法を繰り返した。

周期的なノイズと狭い環境のおかげで、大きなノイズ音が響き渡るMRIの中でも被験者は、慣れてくると夢内容の報告後、多くの場合は5分以内に再び入眠することができた。

夢のデコーディング

夢報告の内容は多岐にわたる。このような不安定な夢報告データを構造化された形に変換するために、まず夢報告文から名詞を抜き出し、意味的な階層構造をもつ言語データベースWordNetに当てはめ、主要な20の物体カテゴリ(車、男性、文字など)に分類した。

このようにして夢報告の内容を各カテゴリの有無を表す20要素のベクトルで表現した。またWordNetに対応した構造を持つ画像データベースImageNetを用いて主要な物体カテゴリに対応する画像収集し、それらの画像を見せた時の脳活動を計測する実験を同じ被験者で別の日に行った。これを機械学習モデルにより解析し、各物体カテゴリの有無を示すスコア(連続値)を出力するデコーダを構築した。

このようにして構築したデコーダを使って覚醒直前のfMRIパターンを解析すると、約3分の1の物体カテゴリについて夢に現れたかどうかを統計的に有意なレベルで判別できることがわかった。入力するfMRIパターンのタイミングを変化させると、覚醒の20秒前まではデコーダの出力スコアが夢報告と相関する。それ以前もスコアの変動は見られるが、これは覚醒時に忘れてしまっていた夢の内容を表現しているのかもしれない。

この研究は2013年に”Neural decoding of visual imagery during sleep”として発表された。この研究は「夢は睡眠中に生じる体験である」ことを確認する証拠の一つとなるが、夢報告を夢の経験内容と完全には同一視できない点や、REM睡眠中の脳活動計測・解析は今後の課題となる。また、この研究の技術的な肝は、実はWordNetやImageNetを使った不定型データの(前)処理であり、夢のデコーディングはそれらに支えられて実現されたものとなる。

コメント

  1. […] 夢と脳と機械学習 – 夢理論から夢のデータサイエンスへ […]

  2. […] 「非侵襲型」では以前”夢と脳と機械学習 夢理論から夢のデータサイエンスへ“でも述べたfMRIのパターンを深層学習を用いて解析するものがある。 […]

モバイルバージョンを終了
タイトルとURLをコピーしました