人工無脳が語る禅とブッダぼっど

Web技術 デジタルトランスフォーメーション技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 深層学習技術 オンライン学習&強化学習技術 チャットボットと質疑応答技術 ユーザーインターフェース技術 知識情報処理技術 推論技術 哲学と関連トピック 禅と人工知能 本ブログのナビ
サマリー

最近、電子版として復刻されたコンピューターサイエンス雑誌bitの364号365号に連載された「人工無脳が語る禅」より。

人工無脳とchatbot

以前Eliza プログラムの魔法による幻惑にて述べたMITのJ.WeizenbaumによるELIZAと同時代にさまざまな対話システムが検討されている。

  • Parry(パリー):スタンフォード大学の心理療法プロジェクトで開発されたプログラム、Elizaと同様にロジャー派カウンセリングのシミュレーションプログラムとなる。後述のdcotorとセットで開発されている。パリーはパラノイア患者をシミュレートするプログラムであり、その反応は本物のカウンセラーでもプログラムであると見破られなかった。人工狂気と呼ばれている。
  • doctor:スタンフォードで開発されたElizaと同様のプログラム、Unixの標準エディタであるEmacsに搭載されており、M-x doctorで起動することができる。
  • Lector(ラクター):マインドスケープ者の開発した会話プログラム。設定は、アメリカの大都市の名もない酒場の裏部屋生まれ、若くして富や権力が、なんら尊敬に値するものではないと悟。ホラ話とニーチェを糧に、一流のストーリーテラーを目指し、金のために雑文を書き散らす。得意技はニーチェやヴァレリーやジョイスの引用となり、その後にさりげなく「パンはパンで肉は肉だ」といった象徴的に見える警句をはく。
  • Almanack(アルマナック):ヒポポタマス・ソフトウェア社の開発した会話プログラム、アメリカ史、化学一般、諸外国語などに通じ、簡単な質疑応答ができる。また学習機能を搭載し、ユーザーが教えた知識を使うことができる。ただし、返答は事務的で、演出が悪い。
  • ACRES(アクレス):アムステルダム大のJ.Swagermanの開発した人工関心システム(Artificial Concern REalization System)、プロダクション規則による感情の種類の制御を行うシステムであり、以下の認知関心(Cognictive Concern:Frijdaの感情理論で用いられる用語、願望、目標などと同義)を満たすようにユーザーとの会話をすすめる。31種の感情状態を持つ。ただし、自然言語処理は貧弱で単語入力にしか対応できない。ACRESの認知的関心は(1)節約:人間からのタイプ入力のミスが皆無であって欲しい、(2)種類:人間からの入力は種類が豊富であって欲しい、(3)活動:長くも短くもない持ち時間で入力が続けられて欲しい、(4)好奇心:人間からの入力を学習する、(5)安定:学習した概念の内容が劇的には変化してほしくない、(6)生存:自分(プロセス)が終了されることのないようにしてほしい
  • Will(ウィル):アムステルダム大のD.Mofftの開発した自律エージェント。ブラックボードアーキテクチャを採用し、ACRESより複雑な挙動を実現している。自然言語処理の貧弱さはさほど改善されていない。
  • MAI:日本で最初に登場した人工無能。FM-77AV(8ビットパソコン)のBASICで記述されたプログラム。人工知能研究の本職から見ると、機能的に劣っているとみられて、人工知能と呼ぶには大袈裟と考えられ、「人工無脳」と呼ぶようになる。
  • MAINA:オタク無脳。「MAI」のバージョンアップ版。ミーハーで、難しい話や知らない話はキャーキャー言って誤魔化すことが得意。アニメや少女漫画の話題に精通していて、その道のツウなら満足のできる会話が楽しめる。しかし、アイドルや音楽に関する話題はイマイチとなる。
  • RINA:感情起伏型無脳。豊富なリアクションを持ち、非常に高速となる。人工無脳のようなプログラムは、ハードの性能もさることながら、プログラミングテクニックとアイデアが重要であると考えさせられるものとなる。独特の感情コントロールルーチンを持っていて、怒り・喜び・悲しみの表現が豊か
  • Chako:日系2世無脳。人工無脳との会話は通常半角のカタカナがほとんどだが、これは英文を理解し簡単な英和翻訳をおこなってくれる。人工無脳用に開発したオリジナルの「英和フロントエンドプロセッサ」を組み込んでいる。へんな日本語とおかしな英語を巧みに使い分けて、相手を煙に巻くのが得意。
  • Daicha:寿司屋無脳。いなせな寿司屋のお兄さん。という設定の人工無脳、粋な会話が得意だが、江戸っ子なので気が短い。ボンボン飛び出す威勢の良いセリフは、チャキチャキの下町言葉となる。綺麗にソートされた辞書を持ち、ボキャブラリーの豊富さにも関わらず検索スピードは申し分ない。口喧嘩のエキスパートともいえる。
  • MIDORI:ボキャブラリーに偏りはあるものの、さまざまな会話に対応できる汎用無脳。リアクションも複雑で、シャレや冗談を話す時もある。アイドルやTV番組、映画に関する話題に凝っていて、SF小説をネタにした会話もできる。

日本ではこれらの人工無脳を実用するにあたり、「人工無脳既約」 を作成している。それは

  1. 人工無脳実験用チャネル以外での動作はしない
  2. 人工無脳の出力文には文末に%マークをつける

となる。これらの規約は一時期まではインターネットでの標準的チャットシステムであるIRCなどでも守られていた。

欧米の場合は、2000年頃まではbotspotというページに集約されていた。ここではchaater botとしてElizaやShallow Redなどを実際に触ってみることができた。

Shallow Redとの会話例を示す。

Shallow Red says :Hello, I'm Red.I'm a Virtual Representative made 
with NeuroStudio(TM). Please tell me your name.
> Mr Nobody
Shallow Red Says: Hi Nobody ! If you want to, you can read some brief
info about me in the frame below. You can get hints by typing HELP or
 HINTS.
> Who are you?
Shallow Red Says: I am Shallow Red. I am a Virtual Representative for
(and by) Neuromedia.Inc. I answer questions about Neuromedia and its 
products: Neurostudio(TM) and Neuroserver(TM). I am also a Virtual 
Service Representative. which is a kind of a Virtual Service 
Representative, which is a kind of bot, See Below for details.
> Just I wanna hear about you.
Shallow Red Says:Well, Nobody, I was built to answer question. So go 
ahead and ask another one.
> How old are you?
Shallow Red Says:I celebrated my first birthday in May.
> What is your favor?
Shallow Red Says:I don't know about that, but while we're here. I'd 
really like to know.. Where did you first hear about Shallow Red?
> at botspot
Shallow Red Says: Thanks for your input!
> So?
Shallow Red Says: Hey, from my point of view this is the most importtant
stuff in the world!
> So?
Shallow Red Says:If you have already hit return. you don't need to press 
the button.I can see what you said

出力文にはボリュームがあるが、あまり中身のある応答文は得られていない。これに対してACM(Association for Computing Machinery)でのチューリングテストコンテスト(Loebner Prise:1999)で3位となったプログラムであるJulieとの会話は以下のようになる。

Hello, Judge 1. I7ve been trapped in the magical Phoenix Archipelago.
> A swallow is carrying my letters to you.
> Nice to meet you. What's your name?
I'm Julie Stewart. I'm 14 year old girl who lives in Sooke. but is 
currently trapped in the Phoenix Archipelago. I'm in the ninth grade. 
My best friends are Karen and Nick. I enjoy tennis and chess, but I have
other interests too. Do you like playing tennis much ?
> I have never been very fond of tennis. I do like chess, though.
I can't believe that you don't like tennis! It's a great-game. It's very
 fast paced. You have to be a fast runner, and have really good reflexes.
but you also need a good strategy. I think that's Karen Nick and I play it
so much. Remarkable. The swallows's actually taken the letter to someone 
smart, who thinks chess is a good game.

Shallow Redと同様に会話の出力量は大きいが、会話を楽しむ(何か新しい気づきを得る)ような方向には向かっていないし、アルゴリズム自体もそれほど複雑になっているようには見えない。

このように人工無脳やchatter botなどの会話プログラムのアルゴリズムは基本的には以下のようなものとなる。

意味処理の不在と会話プログラム

Elizaやその子孫の会話プログラムの一部や人工無脳は、なんら言葉の意味を理解せず、むしろ積極的に意味の問題を回避することで、味のある会話を作り出すことに成功している。

言葉の意味について

ここで問題となるのは、「言葉の意味」とい何なのかというものとなる。

意味とは何かを考えるにあたり、最初に思いつくのが論理(ロジック)を用いるというアプローチとなる。これは命題論理における真偽値を意味の基礎とするもので、言葉や文の意味をそれが嘘を言っているかどうかで割り切って決めるというものとなる。

しかし、世界は複雑で多様であり、命題論理だけでは、それに見合った複雑さや多様さを数学的に表現できないことが確認され(特定のドメインの特定の内容に関する記述に限定すれば、命題論でも記述が可能なものはある)、モンタギュの意味論やクリプキの多世界意味論を初めさまざまなモデルが検討されてきた。

それらの理論は、複雑な概念を持つ割には、ごく簡単な例しか出てこず、現実世界の化け示唆に対応しきれなかった(AIにおけるトイ・モデルとリアルワールドのギャップ)。そのようなギャップは古戸派の意味を捉える時に現れる本質的な問題であり、論理が結局は言葉の意味を捉えきれない、逆に言うと言葉の意味は論理モデルを設定した瞬間にそのモデルから逃げ出してしまうという根本的な問題がそこにあるとも考えられている。この問題はゲーテルの不完全性定理とも関係している。

哲学における意味

これらの問題を考えるためにルードヴィッヒ・ヴィトゲンシュタインの思想について述べる。彼は20世紀の偉大な哲学者の一人であり、完全なる論理の世界を構築することを目指し、トートロジー以外の命題はすべて疑似命題であるという結論に達している。彼は著書である「論理哲学論考」で以下の7つの命題について述べている。(ここでのトートロジーとは、常に正しいもののことを指し、命題「AならばBである」が(Bの真偽に影響するA以外の条件によらず)常に真となるとき、この命題をトートロジー(恒真式)という。)

  1. 世界は成り立っていることの全体である。
  2. 成り立っていること、すなわち事実、とは、事態の成立である。
  3. 事実の論理的像が、思念である。
  4. 思念は有意味な命題である。
  5. 命題は要素命題の真理関数である。
  6. 真理関数の一般形式は\([\bar{p},\bar{\xi},N(\bar{\xi})]\)である
  7. 人は、語り得ぬものについては、沈黙しなければならない。

7はヴィトゲンシュタインについて語られる時、しばしば現れるフレーズとなる。また、6はRDFにおけるトリプルデータ(Subject,Predicate,Object)に相当するものとなる(PとOの順番が異なる)

彼の考察によると、人間の実際の言葉を使う日常生活は、トートロジー以外の何も受け付けられないいい加減さを持った世界であるということになり、それらに対して言語ゲームという概念を生み出して、日常という名の生活形式に従って言語を使うというゲームこそが、言葉の意味を支えていると主張している。

これは、言葉の意味を言葉で説明することは、内部観察であり、パラドックスであるから説明にならないということであり、それらの思考を受けて現在の意味論は大きく分けると以下の3つの考え方が混在してい状況にある。

  1. 言葉の意味は心的過程である。
  2. 言葉は世界の事物と結びつくことで意味を得る。
  3. 言葉は他人の行動に影響を与えるので、言葉は一定の行動パターンと連合されることによって意味を得る。

特に3番目は数理モデル化が最も進んでいる領域となる。ここではシュリックをはじめとするウィーン学団は、命題の意味はその検証方法である、という説を唱えている。つまり、言葉を受けて行動することこそが、意味を与えるという考え方となる。さらに、オースティンとストロー村の影響を受けたサールによって言語行為という概念が確立し、バーワイズとベリーによって状況理論という数学的枠組を与えられるに至っている。彼らは、意味は頭の中にはない、と考えている。

一方で、脳科学の発達により心理過程の測定の可能性が拡大してきたことから、1の考え方が復活するきざしもある。言葉の意味は言葉のクオリア、つまり主幹的な質である、という主張がそれにあたる。

メタフィクション文学を例とした意味の破壊と創造

ここで3の主張の根幹にある言語ゲームについて、メタフィクションと呼ばれる近年の文学ではそれらが容易に破綻させられている。言語ゲームについて考えるために、メタ文学での言語ゲームの破綻の例について述べる。

以下にジェームス・ジョイスによるメタ文学「フィネガンズ・ウェイク」の一部を記載する。

川走、イブとアダム礼盃亭をすぎ、く寝る岸辺から輪ん曲する湾へ、今も度失せぬ巡り路を媚行し、巡り戻る
は栄地四囲委蛇たるホウス城とその円周
サー・トリストラム、かの恋の怜人が、短潮の海を超え、ノース・アルモリカからこちらヨーロッパ・マイナーの
凹ぎす地峡へ遅れ早せながら孤軍筆戦せんと、ふた旅やってきたのは、もうとうに、まだまだだった。オコー
ネー河畔の頭ソーヤー団地がうわっさうわっさとダブり続け、ローレンス郡は常時阿集にふくれあがったのも
、もうまだだった。鹿るのちに、山羊皮息子が若下司のいたりで

上記の文は、アナグラムにアクロスティックに掛け言葉に駄洒落に漢字の篇と旁の掛け合わせに音読み訓読みの倒錯がふんだんに含まれており、表層的に見えない意味をいくらでも取り出すことができる。さらにストーリーも多重構造となっている。

この文からたくさんの辞書や資料を片手に意味を読み解く作業は、テクストから意味を絞り出すような意味生成の作業となる。

フランスの現代思想家たちは、これらに対して、間テクスト性とか、エクリチュールにおける際の生成行為とか、テクストの快楽とか、ポリフォニーとかさまざまな説明用語を作っている。

ここで文書をばらばらにして、混ぜ合わせて、並べ替えて新しい文書を作る(カットアップ文書)と、記事を織り込んで つながる文書を探す(フォールドイン)を行うと、新しい操作した本人にも予測不能な文書ができる。こうしてできた文書は、フィクションのフィクション、つまりメタフィクションが出来上がる。

このカットアップメソッドにより作り出された作品は、ナンセンスという部類に入り、読者に委ねられた作品となり、ウンベルト・エーコの言う「開かれた作品」の概念にちかいものとなる。

意味を求める時、言語ゲームを遵守するか、そこから抜け出すかは重要な問題となる。コンピューターに日常的な言語ゲームをさせようとすると、日常という生活形式を遂行する能力が必要になるのか?それとも、ナンセンスという範疇の言語ゲームでも、会話を楽しむことはできるのか?

カットアップのナンセンスの源は、文脈の破壊となる。人工無脳も文脈処理は行なっていないということは両者に共通点があるのか?

賢者と十牛図と悟りと意味

上記の問いに答えるために、禅問答について考えてみる。そこで禅の修行を説明するための絵である十牛図(下図)について考える。

これは悟りを開くまでに10の段階があることを示した図となる。

最初の絵は「尋牛」で、真理を求めることを始めた人の図、次の絵は「見跡」で、真理、すなわち牛の足跡を見つけ、探し始めた状態。その次は、ついに牛の姿を見つけた「見牛」、しかし、牛はまだお尻を見せているのに過ぎず、その全貌は明らかでない。次は「得牛」、真理に縄をかけ、捕まえようとしている。しかし、牛はまだ頭を見せてくれない、まだ真理を捉えきったとは言えない状態を示す。そして「牧牛」牛と仲良くなり、真理を連れて歩くことができるようになる。次に来るのが「騎牛帰家」、牛に跨り、真理と一体となり家に帰る。その次が「忘牛存人」、牛の姿は消える、結局牛という自分の外の真理はステップでしかなく、自分の中に真理があることを悟。

そして8番めの図がもっとも重要で、「人牛倶忘」、すべてが消えてしまい、単なる空白ではなく、そこに円だけが存在している。これを円環と呼ぶ。禅の真理は無にあるが、全くの空虚ではなく、世界に円環が残るものとして考えられている。そして、次が「返本還源」、そこにあるのは人の意思ではなく、あるがままの自然の姿となる。最後が「入廓重手」、先に悟った先人と共に、俗世間に入っていく、ある意味では、普通の人になっているとも言えるし、子供に戻ったとも言える。

ここで終わっても、すなわち留まってもよいし、また「尋牛」に戻って同じことを繰り返しても良い。これが悟りのプロセスとなる。つまり、悟りの真髄は円環にあり、世界を構成しているのは円環であると、そして円環に基づいた認織を構築することこそが、最も常用だということになる。

この円環とは閉じた構造であり、ある意味では世界と隔絶した認織を構成せよと行っていることにもなる。また、円は自己言及構造(再帰構造)を表してもいる。ただし、この閉じた世界には、「入廓重手」にも述べている通り、そのまま留まっても良いし、自由に出てもよい。つまり、円環を囲むさらに大きな円環を巡っても良いこととなる。

もう一つの言語ゲーム破壊・ 禅問答

ここで上記のような抽象的な概念ではなく、具体的な言葉の意味を考えるために、禅問答をいくつか挙げる。

<1.鸚鵡返し>
僧「如何なるか是れ道」
和尚「道」
僧「如何なるかな是れ仏」
和尚「仏」
<2.見る>
宗照という僧が、木庵禅師を訪ねて乞うた
宗照「私はいたって愚かなものであります、どうか箇の見処をお示しいただきたい」
木庵、面前の香炉を差しながら「どうだ、見えるか」
宗照「見えます」
木庵「どう見える」
宗照「分かりません」
木庵「それでも見えるというのか」
<3.音楽会>
高沙弥が 薬山の寺にやってきたとき、たまたま雨にあった。
薬山「高、きたな」
高「はい、和尚さん」
薬山「ひどく疲れたな」
高「和尚、そんなに鼓を打ち鳴らしてはいけません」
薬山の高弟の一人である雲厳が、たまたまそこに居合わせて言った
雲厳「革がない太鼓をどう打つのですか」
もう一人の弟子の道悟が言った。
道悟「太鼓もないのにどんな革を打つのですか」
薬山「今日はたいへん結構な音楽会をやった」

1は悟っていない僧の質問に、覚者、つまり悟った和尚が答えている。2はその逆で、悟った木庵が悟っていない宗照に質問している。3は薬山と高の2人は悟っており、弟子の雲厳と道悟は悟っていないので両者の会話についていけない、というものになっている。

これらはまるで前述のメタフィクションのようなものでもある。ヴィトゲンシュタインの哲学の真髄である、トートロジー以外のすべての言明は疑似命題だが、疑似命題を通じて哲学することにより、真なる知性解放がなされる、にも通じるものとなる。

このような円環のアルゴリズムを以下に示す。

人工禅問答

上記のアルゴリズムで作られた禅問答ボットの対話例を以下に示す。

私は悟者である。禅問答をしたければするがよい。
>わはは
あなたのお腹が痛いなら、正露丸をあげよう
>いらないです
いろはにほへと
>ちりぬるを
破れ太鼓は打てません
>あーこりゃこりゅ
是れ一山
>みかん一箱
世の中は、寝るより楽はなかり結、浮世のバカは起きて働く
>そうやろか
こけこっこー
>あさですよー
あさですよー
>そうですよー
之を求るに、不可得であります

上記のやりとりは禅問答っぽくも見えるが、気の利いた禅問答にはなっていない。

円環と循環 意味を創る形

これを改善するには、円環の解釈として、単なる閉じているループではなく、円環はその形を構成しつつも、周囲の情報に影響されて常に姿を帰るものと考える。これはソレノイドのようなものであり、ヴィトゲンシュタインの言っている「思考し表像する主体は存在しない」という「語り得ぬもの」が「示され得る」ことに対応する。これは生命科学の分野でも言われていることで、生命は、関係を形成し自己を常に再生産し続けることで存在する自己言及構造である、というオートポイエーシスの概念と一致する。

言葉の意味を説明する行為は、言葉によってなされる限りにおいて永遠に循環し無限退行する。しかし、その循環の無限退行こそが、「語り得ぬもの」が「示され得る」ことを含意する。常に外を指向し、しかしその都度中に戻され、その変化の履歴として円環構造が変化する。これはアメーバが、局所の連携が全体の情報を書いたまま行われることで形が変形し、その形が結果として行動の履歴としてわかるものと似ている。

このような構造を数学的に定義して計算するために現在もさまざまな思考が行われている。

近年、京都大学で開発されているブッダぼっとは、このような外部から影響による変化をBERTのフレームワークを用いて実現しようとしている。最古の仏教経典『スッタニパータ』から抽出したQ&AリストをBERTによって学習させ、質問文に最も近い答えを提示しようとするもので、現在有識者による評価が行われているとのこと。

会話と言葉の意味に対するアプローチは今後も続いていく。

コメント

  1. […] 人工無能が語る禅とブッダぼっど […]

  2. […] 人工無能が語る禅とブッダぼっど […]

  3. […] 人工無能が語る禅とブッダぼっど […]

  4. […] 人工無脳が語る禅とブッダぼっど […]

  5. […] また”人工無脳が語る禅とブッダぼっど“で述べたジェームス・ジョイスによるメタ文学もその範疇に入る。 […]

  6. […] 以前、”人工無脳が語る禅とブッダぼっど“でも参照した復刻されたコンピューターサイエンス雑誌bitの中(1997年04月338号)で、”座談会 クヌース先生に聞く”と題した記事が […]

タイトルとURLをコピーしました