深層学習を使った俳句の自動生成と知性と世界の認織

Web技術デジタルトランスフォーメーション技術人工知能技術自然言語処理技術セマンティックウェブ技術深層学習技術オンライン学習&強化学習技術チャットボットと質疑応答技術ユーザーインターフェース技術知識情報処理技術推論技術禅と人工知能本ブログのナビ

AI研究者と俳人人はなぜ俳句をつくるのか

AI研究者と俳人人はなぜ俳句をつくるのかより。

AI研究者と俳句

本書は北海道大学でAI研究を行っている川村秀憲教授によるものとなる。川村教授はAI川柳のシステムをも作っており、それらは川村研(調和研)のツイッターでも見ることができる。たとえば世界平和に関する句として「人類の平和を祈り笑い合う」やピアノをお題にした句として「久しぶり妻にピアノを聞かされる」などがある。

その川村教授が、俳人(大塚凱)の作った俳句を深層学習で学習した人工知能「一茶くん」を作り、その中から良いものを大塚さんから選んでもらい、更にその内容について教師データの元(俳人(大塚凱))と議論するというタスクを行なっている。それらを通して以下のような人工知能研究の課題について考えていこうというのが本書の目的となる。

人は世界の認織をどう行っているのか
現実世界の情報や概念をどうやって記号に結びつけるのか
感情とはどういうものなのか
コミュにレーションが成立するとはどういうことなのか
人間関係の基本である愛とは何なのか
知能にとって身体性の意味とは
人と人工知能が共存する未来とはどのようなものなのか

俳人(大塚さん)との議論の中で、自分の俳句を元にして「AI一茶くん」が生成した句を見ると、その中に自分がいるような感覚を感じ、他人の俳句から選句するときとは明らかに異なった不思議な感覚を覚え、そのような不思議な感覚はなぜ生まれるのかという考察の中から、「知能とは何か」という根本的な問いへの答えのヒントを見つけたり、俳句にとっての季語の存在意義として、人がコミュニケーションする際の前提となる「共通知識」について考えたり、俳句という言葉を通してのコミュニケーションについての考察では、コンピューターでアナログ情報を扱うときのエンコード/デコードとの対比で、俳人は俳句で何を楽しんでいるのかについて考察を深めたりしている。

そして、最後に句会に人工知能を参加させ、人に混じって出句させ、選句させたときに人工知能と見破れるかどうかをテストする俳句版チューリングテストの話題や、人工知能で俳句をつくることの意義、人工知能や俳句で愛をどうやって扱うのかについての議論が展開されている。

河村教授は、大塚さんとのこのような対話を通して「人はなぜ俳句を詠むのか」という疑問と、「人工知能でどうやって俳句を作るのか」という興味がともに「知能」の働きそのものから出てくると述べている。

以下に本書の詳細な内容と、その後に付録として記載されていた「AI一茶くん」の俳句生成のしくみについて述べる。

第一章：コードと歳時記―「人間の営み」を解明する

AI研究者にとって、俳人にとって
不思議な選句体験
根源的ななぜ
Tipsとしての季語
鯖雲人に告ぐべきことならず　　加藤秋也
歳時記というレガシー
よく眠る夢の枯野が青ずむまで　金子兜太
AIに常識がない
恋の機敏とAI
時代によって変わる解釈
エンコードする作者、デコードする読者
一つの句が時空を超えて
作句はデジタル、読解はアナログ
作者と作中主体

第二章：記号と意味―ハードルは何か

記号を知らずに作る俳句
「悲しい」をイメージできるか
「助詞」を可視化できるか
無尽蔵に作れても選句できず
秀句を「特徴量」で数値化

第三章：教師データと逸脱―「ＡＩ一茶くん」の俳句を鑑賞してみる

本歌取り、パロディを見つける
性愛モチーフへのアプローチ
強く感じる男性視点
教師データのバイアス
「言葉遊び」や「押韻」は可能か
固有名詞は得意
期せずして出現する話し言葉
無駄と捉えてしまうリフレイン
弾いてしまう「字余り」
評価のばらつきは小さい
添削はAI、推敲は人間

第四章：チューリングテストと句会―「詠んだ」といえる日は来るか

俳句は「他者理解」か「自己理解」か
AIがオンライン句会に登場する日
「詠む」のか「書く」のか「生成する」のか
AI俳句への嫌悪はどこから来るか
AIが俳句を詠むことに意味はあるか
手形のようにことばが流通する心地よさ
AIが俳句を終わらせる可能性
前景化するコンテクスト
季語の動的平衡
季語の貨幣性

第五章：無意識と感情―「知能とは何か」という根源的問い

他人の成長過程
抽象度を上げると見えるもの
「書いている」のか「書かされている」のか
whatは面白く、howはシンプルに
「わからないけれど、おもしろい」
恋愛できないAIが語る恋愛
答えのない哲学的な問い

付録：

「AI一茶くん」俳句生成の仕組み

AI一茶くんで俳句を生成する過程は、大きく分けると二つある。一つが、俳句を構成する単語を一つ一つ選んで順に繋げ、俳句になりそうな単語の並びを生成する。次に、このように生成された単語の並びに対して、有季定型句の条件を満たしているか、意味を成しているかを推定し、条件を満たすものだけを選別する。

こうしたことを行うために、一茶くんはディープラーニングによる「言語モデル」を用いている。

一茶くんに用いる言語モデルでは、一般的な言語モデルと異なり、日本語の文学作品を教師データとして与える。数が限られた俳句だけでは単語の関係性を十分に教えるだけのデータを揃えることができないため、情景描写が重視され俳句と共通点があると思われるデータをまず学習させる。たとえば、音数が五・七・五になる三文などが教師データに含まれる。

次に、音数の制約や季語といった俳句に固有の特徴を学ばせるため、人の詠んだ俳句のデータを追加で学習させ微調整を行う。生成の手順は以下のようになる。

- 先頭から順番に単語を選んで並べていく

一茶くんで俳句を生成するときには、まず俳句を生成するよう学習した文書生成モデルを用いて、俳句らしい単語の並びを作り出す。それぞれの単語が表される確率をニューラルネットワークを用いて計算し、その確率に従って目が出るサイコロでコンピューターがランダムに選んで、先頭から順番に単語を選んで並べていくことで文章を生成する。

普通のサイコロはどの目も等しい確率で出るように作られているが、ここで振るサイコロ(乱数)は文章生成モデルが計算した確率に従って、出やすい単語と出にくい単語に差がついている。文章生成モデルが先頭に来る確率が高いと推定した単語は選ばれやすく、確率が低い単語は選ばれにくい。

二番目以降に置かれる単語も、同じように文章生成モデルで現れる確率を計算し決めていくが、先頭にある単語について計算した時と異なり、その前にどのような単語があるのか、何音目であるか、季語はすでに現れたかどうかなど、さまざまな条件により確率は変わってくる。そのため、文書生成モデルはこれまで選ばれた単語列の全てを受け取り、そりに応じて次に単語が現れる確率を計算する。

- 条件に合わない俳句を取り除く① 教師データに似すぎていないか

文章生成モデルは人の詠んだ俳句から完璧に学習できているとは言い難く、一茶くんの文章生成モデルでつくる文章は、季語の含まれていないものや、十七音になっていないようなもの、意味の通らない文章を生成することも多々ある。逆に、文章生成モデルが学習した俳句と全く同じものをそのまま生成してしまうこともある。

こうした不完全俳句をできる限りなくし、質の高い俳句だけを最終的につくるために、一茶くんでは生成された俳句を評価して条件に合わないものを取り除く処理を行なっている。

まず、生成された俳句と教師データとして用いた俳句を一つずつ突き合わせ、教師データの俳句とあまりに似ているものを一茶くんの生成結果から除外する。一茶くんで生成した俳句が人の詠んだ俳句と完全に一致した場合はもちろん、女子を一文字だけの変えただけのような明らかに似ている俳句であった場合にも除外の対象とする。

そこで、教師データとの間で編集距離を計算し、一定以下の距離の俳句は除外することにしている。編集距離とは、二つの文章を比べたときに文字の追加・削除・変更などを最低何階行うことで片方からもう片方の文章に作り替えることができるか、その回数となる。

- 条件に合わない俳句を取り除く② 有季定型の条件にあっているか

次に有季定型の条件にあっていないものを取り除く。有季定型句であるかどうかを判定するには、俳句を構成するためには、俳句を構成する言葉の音数や、俳句の中にある言葉が季語や切れ字かどうかを調べる必要がある。国立国語研究所が日本語に現れるさまざまな言葉を分類した辞書を公開しているので、これを用いて生成された俳句の言葉を分割していく。分割された言葉の最小単位を国語学の用語で形態素と呼び、文章を自動的に形態素に分ける技術を形態素解析と呼ぶ。この辞書にはそれぞれの形態素に読み仮名が振られているので、そこから音数を数えることができる。

もし生成された俳句の形態素の中に辞書の中にない未知の形態素があると判定されたときは、文章生成モデルが誤って本来の俳句にない言葉を生成してしまったと考え、その俳句を除外する。形態素解析の結果から、生成された俳句に含まれる形態素の音数が合計十七音になっていなかったり、五音・七音・五音の間にまたがる形態素が含まれていたりする場合にも、同様にその俳句は取り除かれる。

一茶くんには　俳句の中で用いられる季語や切れ字の辞書も事前に登録されており、この辞書と俳句の中の形態素を比較して、生成された俳句の中に含まれている季語や切れ字の数を数える。季語が含まれていない俳句や二つ以上含まれている俳句、切れ字が②回以上現れる俳句などは、有季定型句の一般的な型から外れ、条件を満たさないので、これも除外する。

- 条件に合わない俳句を取り除く③ 意味の通るものになっているか

さらに、一茶くんで生成された俳句が意味の通るものになっているかどうかを推定することも行なっている。俳句を生成するために利用した生成モデルを使って、生成された俳句全体を通して単語の並びが崩れる確率を推定し、現れる確率が高いものほど意味の通る俳句の可能性が高いと判断できる。

文章生成モデルが良さそうだと判断した俳句が必ずしも意味が通るわけではないが、悪そうだと判断した俳句には明らかに意味の通らない俳句が多く、こうした評価はある程度機能していることがわかっている。

　　次のレベルに行くための課題

今後「AI一茶くん」に残された課題として、俳句の前の「伝えたいこと」をどうやって表現するのか、そしてそれをどうやって言葉に変換するのかがある。現在は無から俳句を生成しているという状態であり、それではエンコードとデコード、すなわち生成と解釈の問題を避けていることになる。「AI一茶くん」が次のレベルに行くためには選句と批評をどう扱えばよいのかを解決する必要がある。

もう一つの大きな課題は、マルチモーダルな情報をどう扱っていくのか、モードの違う情報をどう結びつけるのかを考える必要がある。目で見た、肌で感じた感覚を言葉に落とす、逆に言葉から感覚を想像する、さまざまなモードの情報が行き来して初めて人と共有知識を持てるようになる。

入門・俳句の〝読み〟方

根幹をなす音とリズム
「切れ」のメカニズム
「切れ字」が示唆するもの
「季語」が重要視される理由
形式との戦い

本書の内容をおおまかに知るためのキーワード

Deux Ex Machina

AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。

Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.

AI研究者と俳人 人はなぜ俳句をつくるのか

コメント

AI研究者と俳人人はなぜ俳句をつくるのか