具象と抽象 – 自然言語のセマティクスと説明

人工知能技術 機械学習技術 オントロジー技術 デジタルトランスフォーメーション技術 知識情報処理技術 強化学習技術 確率的生成モデル技術 説明できる機械学習技術 自然言語処理技術 構造学習 問題解決と思考法及び実験計画 life Tips&雑記 本ブログのナビ
具象と抽象 – 自然言語のセマティクスと説明

具体と抽象の観点は、自然言語処理の意味的アプローチや構造的な機械学習を行う場合や、説明できる機械学習を行う際に非常に重要な視点となる。「具体と抽象-世界が変わって見える知性の仕組み」より、それらについてまとめてみる。

我々のまわりの世界はつきつめると「具体」と「抽象」という2つの対立概念から成り立っている。「具体」という言葉がもっとも用いられるのは、何かをわかりやすく説明するときに「具体的に言うと…」とか、相手の話がわからないときに「もう少し具体的に話してもらえませんか?」のような場合となる。逆に「抽象」という言葉は「あの人の話は抽象的でわからない」といった文脈となる。

このように「具体=わかりやすい」「抽象=わかりにくい」というのが一般的に認知されているこれらの概念の印象となる。このように「抽象」という言葉は負の印象をもたれることがや多いが、実際は人間の思考の基本中の基本であり、人間を人間たらしめ、動物と決定的に異なる存在としている概念でもある。

「抽象化を制するものは思考を制す」といっても過言ではないくらいに抽象という概念には威力があり、この「具体」と「抽象」の行き来を意識することで、間違いなく世界が変わってくるものでもある。

人間が頭を使って考える行為は、実はほとんどが何らかの形で「具体と抽象の往復」をしていることになり、これは「具体化」と「抽象化」が人間しか持っていない頭脳活動の根本にあるということでもある。この「具体」と「抽象」の概念をまとめると以下のようになる。

具体は通常「目に見える」観測可能な実体と直結し、抽象は「目に見えない」もので、実態とは乖離したものとなる。抽象に正確に対応した言葉として「具象」もあるが、ここでは一般に用いられて認知度の高い「具体」という言葉で統一する。

具体は一つ一つの個別事象に対応したもので、抽象はそれらを共通の特徴で一つにまとめて一般化したものとなる。つまり複数(N)の具体に対して一つの抽象が対応する「N:1」という対応関係となる。

従って、具体的な表現は、解釈の自由度が低い、つまり人による解釈の違いがほとんどないものになり、反対に抽象的な表現は、解釈の自由度が高く、人によって解釈が大きく異なる場合がある。解釈の自由度が高いと言うことは、応用が効くこととなり、これが抽象の最大の特徴となる。

学者や理論家の仕事は通常、複数の事象を一般化・抽象化することで理論化・法則化して、誰にでも役立つ汎用的なものにすることであり、一方で、理論化されたものはそのままでは実行することが難しいので、それを具体化する必要がある。そのために実務家は、具体レベルでの実行を重視する。

抽象化を利用して人間が編み出したものの代表例は「数」と「言葉」となる。それらを編み出しことにより、人は言葉や数を自由に操り、それによって知識を蓄積し、科学のように役立つ体型的な理論として構築し、再現可能とすることでさまざまな「道具」を発展させて活用できるようになった。

また言葉や数を操ることは、人間の知能の基本中の基本で、言葉がなければ、コミュニケーションも知識の伝達も不可能で、さまざまな道具や紙、技術を発展させ、伝承させることができるのも、言葉や数(や記号)によってそれらを記述し、記録することができたからに他ならない。

「数」や「言葉」が成立するためには、「まとめて同じ」と考えることが不可欠となる。まず「数」に関して言うと、りんご3個も犬3匹も本3冊も「まとめて同じ」と考えることから「3」という数が成立してくる。言葉も同様にまぐろもサケもカツオもまとめて「魚」と呼ぶことで、「魚を食べよう」とか「魚は健康に良い」という表現が可能になり、「魚類」の研究が進むこととなる。「魚」という言葉(や同等の言葉)を使わずにこれらを表現しようとすると、いちいち個別の魚の名前を全てあげることが必要になってくる。

このような具体と抽象の関係は以下のように表される。

 

この三角形は次のことを抽象的に述べたものとなる。

  • 複数の具体を「N:1」でまとめたものが抽象であるという関係(だから下へ行くほどひろがっていく)
  • 具体⇄抽象という関係は、相対的に連続して一体となっている。(たとえば「鮭」は「魚」の具体でもあり、個別の鮭の抽象でもあるというように、あくまでも相対的にどう見るかで具体か抽象かが決まる)

人間の言語能力は抽象化能力と表裏一体のものとなる。たとえば飼い犬との自動翻訳が可能になったと言う思考実験を考えたとき、

「ご飯食べる」
「えっ? 何ですか? 「ごはん」って」
「「エサ」のことだよ」
「えっ? 何ですか? 「エサ」って」
「ローファットフードだよ、スーパーペット社製の...」
「えっ? 結局何を食べられるのかよくわからないなぁ」
「昨日の夜も食べたでしょ?玄関の下駄箱の横に置いておいてあるあれのことだよ」
「ああ、「あれ」のことですね。難しい言葉で言われたので、なんのことなんのことだかさっぱりわかりませんでした」

犬はたとえ話せるようになっても、抽象化された概念の理解力が良いわので、右のような会話になってしまう。基本的に「具体的に」ものを見せられなければ、言葉では抽象的すぎてわからないということになる。実際に、上の会話でも抽象的な概念が用いられているので、こうした河合ですら犬には簡単にできないものとなる。

抽象化とは、一言で表現すると「枝葉を切り捨てて幹を見る」こととなる。これは文字通り「特徴を抽出する」ということで、さまざまな特徴や属性を持つ現実の事象のなかから、他のものと共通の特徴を抜き出して、ひとまとめにして扱うと言うものとなる。

これは裏を返せば、共通の特徴とは関係のない他の特徴はすべて捨て去ることを意味し、先の言葉で言えば「共通の特徴」が幹、「それ以外の特徴」が枝葉ということとなる。

一つの事象からどんな特徴を取り出すかは、その時の目的や方向性により変わる。「一人の人間」をとっても「学生」「健康体」「体重70kgの人」「未婚者」など様々な形の「特徴の抽出方法がある」

たとえば一人の人間を抽象化するにも、銭湯やトイレという場面であれば「男性か女性か」という特徴が必要だし、映画館の料金を決定する際に関しては、「社会人か学生か子供か」という属性が最も重要な特徴となる。

「枝葉を切り捨てる」のが抽象化の基本である以上、必要以上に細部にこだわるのはマイナスだが、かたや「神は細部に宿る」という言葉があるように、細部へのこだわりが重要になることもある。これらを使いわけるときに重要となるのが「目的」となる。

樹木の場合は、どれが「幹」でどれが「枝葉」であるかは固定されているが、抽象化における「幹」と「枝葉」は目的によって異なる。ところが人間のこだわりは目的によって変えるのが難しいために、周りから見ると「枝葉にこだわっている」人は多いように見える。

「投げる」「蹴飛ばす」といった動詞。「姿勢」「基礎」といった名詞。「美しい」「優しい」といった形容詞。「まっすぐだ」「きれいだ」といった形容動詞。これらの言葉は、すべて目に見える物理世界で用いられる場合と、比喩として精神世界で用いられる場合があり、二通りの使い道がある。

たとえば(ボールを)「投げる」という物理的動作を「あきらめて放棄する」という抽象概念と結び付け、同じ投げるという言葉を使う。このように「体の動き」を「心の動き」になぞらえる考え方は日本語に限らず他の言語にもあり、これは人間が生まれながらに持っている「感覚」によるものでもある。

このように、単に目に見える具体的な世界で起こっている事象を精神的な世界にも拡大して(あるいは「目に優しい」のように精神世界の表現を物理世界に逆方向に拡大して)思考の幅を広げられると言うのが人間の脳の優秀なところとなる。

物理的な実際の世界を、精神世界の感情や論理にまで延長させて、物理的な世界と同様の世界を頭の中だけで作り上げる(たとえば「あきらめる」という心理的な状況はまわりの人の目には明示的には見えないはず)のは、人間にしかできない知的な芸当となる。

動物には(おそらく)物理的な世界しか存在せず、精神世界があっても、人間の世界とは比較にならないわずかなもので、それも(おそらく)、物理的な世界と直接的に紐づ他ものはほとんどない。人間が楽しんだり悲しんだりするのは、「よくも悪しくも」抽象化と言う行為のおかげとなる。抽象化によって人間の精神世界が何十倍にも広がる。

抽象化の最大のメリットは、複数のものを共通の特徴をもってグルーピングして「同じ」とみなすことで、一つの事象における学びを他の場面でも適用することが可能になる事になる。つまり「一つを聞いて十を知る」こととなる。

このように抽象化とは複数の事象の間に法則を見つける「パターン認識」の能力であると言うこともできる。身の回りのものにパターンを見つけ、それに名前をつけ、法則として複数場面に活用する。これが抽象化による人間の知能の凄さの一つとなる。

具体レベルの個別事象を、一つ一つバラバラに見ていては無限の時間がかかるばかりか、一才の応用が効かない。一般に「法則」とは、多数のものに一律の公式を適用でき、それによって圧倒的に効率的に考えることを可能とする。

ここでいう法則とは物理的な法則だけではなく、以前述べたヒューリスティック(「夕焼けが出れば明日は晴れる」のような経験則)や、会話の相手が怒っていたり喜んでいたりする状況を相手の表情から読み取れると言う暗黙の判断まで含む。

抽象化の概念のうち、ここまで述べたもの以外のものとして「関係性と構造」という側面がある。具体のレベルは基本的には「個別・バラバラ」の世界であり、一つ一つの事象をすべて個別に扱うのが具体とすれば、それらをまとめて「関係性」や「構造」として扱うものが抽象となる。(下図)

ここでの「構造」は、二者以上の複雑な関係性のセットを指すこととするので、基本的には「単品」で考えるか、「関係性」で考えるかの違いとなる。

前述の鮭→魚→動物..といった抽象化は、基本的には前者が後者の「部分集合」であるという関係(単純に包括的である)と言うものに対して、例えば「反対語」という言葉(概念)は、賛成⇄反対、自動⇄手動といった、二つの言葉の「関係性」を抽象化したものとなる。

関係性は、一般には直接目に見えないという特徴をもっており、これは先の抽象化と同様になる。物理的な法則、たとえば、F=maというニュートンの運動方程式も力(F)が質量(m)と加速度(a)の積になるという「関係性」を表したものとなる。

関係性を一般化して法則にできる抽象化能力も、人類の知の発展に計り知れない貢献をもたらす。「関係性」をこのようにとらえるには、事象を個別にみるのではなく、ある程度の複数の事象をまとめて「上から」眺めることが必要となる。

具体的な関係性年は、歴史の勉強がある。一つ一つの個別の出来事の年代を暗記しているだけでは、それらの関係は見えず「因果関係」をとらえて、それらを将来に活かすことが歴史を学ぶことの一つの大きな意味だが、そのためには抽象化の視点がかかせない。

抽象化のツールとして「シンプルな図解」が挙げられる。図解は「関係性」を表現するためのもので、一つ一つの図形の「個性」を極力拝して、「丸」とか「三角」にしてしまい、それらがどのような関係になっているかという、相対的なつながりのみを表現することが図解となる。

「たとえ話」は、説明しようとしている対象を具体的につかんでもらうために、抽象レベルでお何時構造を持つ別の、かつ相手にとって卑近な世界のものに「翻訳」する作業と言える。これは、説明したい新しい概念や事例を、身近な事例で似ているものを使って説明するもので、たとえば話のうまい人とは「具体→抽象→具体という往復運動による翻訳」に長けている人のことを言う。

上手い例え話の条件としては以下のようになる。

  • たとえの対象がだれにでもわかりやすい身近で具体的なテーマになっている。
  • 説明しようとしている対象と右記テーマとの共通点が抽象化され、「過不足なく」表現されている。

「抽象化の品質」を決めるのは二点目の条件で、共通点が他には当てはまらないような共通点であること、そして二つの領域の相違点が、説明したいポイントとは関係ないものであることが重要になる。(そうでない例え話はフィット感がなく「なんかちょっと違う」ものとなる)

つまり、「共通点と相違点」を適切に掴んでいることが抽象化、ひいてはたとえ話の出来栄えを決定するものとなる。

学問は多かれ少なかれ、抽象化概念を扱ったものとなるが「往復運動」すなわち「抽象化」と「具体化」を分けて考えてみると、それらの中にも「抽象化」をメインにしたものと「具体化」をメインにしたものがあることがわかる。

たとえば理系の学問に「理学」と「工学」があるが、これらはある面において「正反対」となる。「抽象化」(具体→抽象)という方向なのか(理学)、逆に「具体化」(抽象→具体)と言う方向なのか(工学)の違いがあるからとなる。

学問の目的は、大抵の場合は具体的事象から理論を導いて抽象化して理論化することで汎用性を上げるが、工学は、基本原理から応用例を作り出して実践につなげるのが主な目的となる。

徹底的に抽象度を高めた学問の代表が数学と哲学で、抽象化の対象を論理の世界だけで説明するもの(純粋に理論的なもの)が数学で、対象が人間の思考や感情など、理論や論理だけでは説明がつかないものが哲学となる。

何が具体で何が抽象かは、絶対的なものではなく、お互いの関係で成り立つ。つまり「具体と抽象」という言葉自体が「相対的な関係性」を示す概念であって、絶対的な具体性や絶対的な抽象性があるわけではない。

たとえば「おにぎり」と言う言葉は、「鮭のおにぎり」「おかかのおにぎり」を抽象化した言葉として捉えることもできるし、「食べ物」を具体化して言葉としてとらえることもできる。つまり「個別のおにぎり」→(抽象化)→「おにぎり」→(抽象化)→「食べ物」というふうに、具体→抽象と言う関係は、どこまでも続けることができる。

したがってAさんが具体と考えていることは、Bさんにとってはちっとも具体的だと思えないこともある。その逆も真なりとなる。

例えば、会社における上司Aと部下Bの会話を考えると

上司A「B君、この前コメントした会議の案内、まだ直っていないみたいだけど」
部下B「ああ、あれですね。一部コメントの意味が分からなくて、そのままになっているですけど」
上司A「たとえば、どこ?」
部下B「会議の目的を記載することっていうコメントです。目的は記入したつもりだったんですけど」
上司A「開発仕様書をレビューするってこれは目的かな?」
部下B「そのつもりですが」
上司A「それはあくまで手段じゃないの?」
部下B「だって、開発部長が揃う会議では、それが目的じゃなかったんですか?」

目的と手段も、すべて相対的なものになる。目的一つに対して手段は複数という形で階層が成立するが、目的はつねに、さらに抽象どの高い「上位目的」が存在する。

ここでは「レビューすること」自身が目的だと考える部下Bさんに対して、たとえば「投資の意思決定をするため」とさらに上位目的で考える上司Aさんはそれが単なる手段の一つにすぎないととらえる。

このように「抽象度の低い」目的と(抽象度の高い)「上位目的」の関係は、普段どこをみているかによって変わって見える。このようなズレや行き違いが怒るのは「具体か抽象か」の尺度が相対的なものであるからとなる。

また具体と抽象はこのように「上下」で階層構造を築いている。具体と抽象の関係が階層的になっているというのは、先の「魚」の例で言えば、下図のようになる。

このように抽象化の構造が階層的になっていることで、上位の階層が持っている性質を回の階層がそのまま引き継ぐということになり、抽象化の威力がさらに増す。この性質は学問や知の発展に大きく貢献する。

 

事象を具体レベルで見ているか、具体と抽象を結びつけて考えるかは、たとえば500ページの本を「短時間でかいつまんで説明」してもらうとよくわかる。

具体レベルで考えている人は500ページの本を3分でかいつまんで説明してほしいというと、「じかんがないので最初の三章だけ」か「各章のはじめの部分だけを抜き出す」という選択しかない。同様に「100枚の付箋のアイデア抽出」をおこなって、その結果を「3分でまとめて話せ」と言われるとパニックになる。

これに対して抽象化して話せる人は、「要するになんなのか」に対して、膨大な情報の中から「構造」を抽出し、なんらかの「メッセージ」を読み取る。しかもそれらの「構造」や「メッセージ」は複数の階層からなる抽象のレベルで理解しているので、1分なら1分なりの「要するに」を30分なら30分なりの「要するに」を話すことができる。

これらにとって重要なの、膨大な情報を目の前にしたとき、その内容を様々な抽象レベルで理解しておくことになる。抽象化の能力は、インターネット常にあふれる膨大な情報から自分の目的に合致した情報を短時間で収集したり分析したりする場面でとくに力を発揮する。

そこで行われていることは、場面場面での目的に応じて「幹」と「枝葉」を見分けることで、要点をつかみ、必要に応じて必要な領域についてだけ、徹底的に具体的なレベルにまで折れることが行われている。

コメント

  1. […] この関係は「具象と抽象 – 自然言語のセマティクスと説明」にも述べているように、抽象化のステップ(具体的な事物から抽象化されたものが上記で言うところのブラックマターという解釈)の観点から考えてもイメージすることができる。 […]

  2. […] 自然言語の観点からの抽象と具体 […]

  3. […] 説明するということ-具体と抽象 […]

  4. […] 具体と抽象と言葉の構造 […]

  5. […] のハンドリングの一つの側面として、抽象化や推論がある。抽象化は「具象と抽象 – 自然言語のセマティクスと説明」でも述べているように、多数の事象や事物から共通する特徴量をま […]

  6. […] 本ブログでは”問題解決手法と思考法および実験計画“において、様々な問題解決手法についてのべている。その中で、”KPI KGI OKRについて“で問題解決を行うための定量化の手法について述べていたり、”具象と抽象 – 自然言語のセマティクスと説明“で述べているような抽象化のステップを用いることでその課題の本質的な問題は何かを抽出している。 […]

  7. […] 本ブログでは”問題解決手法と思考法および実験計画“において、様々な問題解決手法についてのべている。その中で、”KPI KGI OKRについて“で問題解決を行うための定量化の手法について述べていたり、”具象と抽象 – 自然言語のセマティクスと説明“で述べているような抽象化のステップを用いることでその課題の本質的な問題は何かを抽出している。 […]

  8. […] “自然言語の観点からの抽象と具体“で述べているように言葉の意味は、現実の事物から離れた抽象世界にあり、”人工無能が語る禅とブッダぼっど“で述べているようにそ […]

タイトルとURLをコピーしました