ヘレン・ケラーに学ぶ現在の自然言語処理に欠けている重要なもの4

ヘレン・ケラーに学ぶ現在の自然言語処理に欠けている重要なもの4

2018.02.25
このエントリーをはてなブックマークに追加

言葉を獲得するまでのヘレンは、気に入らないことがあるとすぐに癇癪を起しました。
怒っていても、楽しいことがあると、すぐに機嫌が直ってはしゃぎだします。

まるで、動物のようです。
知らない人が家に来たら吠えて、その人からエサをもらうと喜ぶ、
犬と同じです。

言語獲得前のヘレンの心の構造を図に表してみます。

「意識」は、見たり、聞いたり、触ったりして外部世界を知覚によって直接認識します。
心は、感情を持っています。
感情とは、認知パターンの一種で、動物の場合、怒ったり、喜んだり、怖がったりといった単純な感情のみ持っています。
言葉を獲得する前のヘレンの持っていた感情は、これだけです。

 

次の図は、言語を獲得した後の心の構造です。

意識は、外部世界の情報を、言葉を介して認識します。
言葉とは、記号です。

ここでは、言語が扱う領域を「記号レイヤー」と呼ぶことにします。
フォトショップの「レイヤー」のイメージです。
意識は、記号レイヤーを通して外部世界を認識します。

記号レイヤーには、外部世界に存在するものを記号化したものがあります。
家、机、椅子、・・・など、あらゆるものです。
また、お父さん、お母さん、先生など、人物も記号化されます。

目に見えたり触ったりできるものだけでなく、昨日、今日、明日といった時間の概念も記号化されます。
さらに、嬉しいや悲しいといった感情や、善悪といった社会のルールなども記号化されます。

意識は、記号化されたものを認識します。
したがって、記号レイヤーを通して世界を認識することで、知覚だけでは認識できない時間やルールといったものも認識することができます。

認識した記号を認知パターンに当てはめて感情が生成されます。
認知パターンには、「後悔」や「嫉妬」といった複雑な感情も含まれます。

「後悔」を理解するには、過去といった時間や、自分の取った行動を認識する必要があります。
自分の行動を認識するには、客観的に自分を認識する必要がありますが、これも記号レイヤーに存在します。

喜んだり怒ったりといった単純な感情は、動物にも存在しますが、後悔や嫉妬といった複雑な感情や、善悪や恥といった感情は人間のみが持ち得る感情です。
「後悔」を理解するには、自分の行った行為を客観的に認識する必要があります。
客観的に自分を認識するには、「記号レイヤー」を使わないとできません。
言語獲得前のヘレンは、怒ったり、喜んだりといった単純感情しか持たず、動物と同じでした。
ところが、言語を獲得したとたん、今朝(言語獲得前)、自分で壊した人形を見て、「なんてことをしてしまったんだ」と後悔の念に陥ります。
言語を獲得したことで、人間の心が目覚めたのです。

 

ここで、言語獲得前のヘレンと言語獲得後のヘレンの心の構造を整理してみましょう。

 

図で♡を付けた個所が、言語獲得後に目覚めた機能です。
これが人間の心の核となる部分です。

ヘレンは、「w-a-t-e-r」が、今、手のひらを流れる冷たい液体の「名前」であると気づいた瞬間、この世のすべての物に「名前」があると理解しました。
ヘレンが、言語を獲得した瞬間です。
そのとき、意識は、記号レイヤーに初めてアクセスしたのです。
初めて、記号レイヤーを介して世界を認識したのです。

記号レイヤーには、今、直接感じている世界だけでなく、時間や、自分自身など、抽象的な概念も存在します。
人間の心の中にしか存在し得ないものも、記号レイヤーには存在するのです。

起こった出来事の意味を理解するとは、出来事を認知パターンに当てはめて、何らかの感情が生じることです。
後悔や嫉妬、善悪といった人間しか持ち得ない認知パターンは、時間や自分自身といった、記号レイヤーでしか扱えないもので構成されます。

 

ここで注目したいのは、人間の心の核となる記号レイヤー、認知パターンは、ヘレンが、言語獲得以前から既に持っていたということです。
言葉を学習することで、心が徐々に成長したわけではありません。
ヘレンが、「w-a-t-e-r」が「名前」であると気づいた、その10分後に、「後悔」という感情を初めて経験したことがその証拠です。
これは、10分の間に、「後悔」という感情が新たに作り出されわけではありません。
既に存在していたが、使われることがなかった「後悔」という感情に、言語を獲得することでアクセスできるようになったということです。
目が見えず、耳が聞こえなかったため、通常なら、自然とアクセスしていた記号レイヤーに、ヘレンの意識がアクセスできていなかっただけなのです。

 

さて、現在の自然言語処理について考えてみましょう。
現在の自然言語処理で扱っているデータは、単語の出現頻度や、単語の並び順など、いわば、文に出現する単語次元のデータと言えます。
心の核となる記号レイヤーで扱うデータは、文に出現する単語だけでなく、その背後に存在する時間や空間、善悪といった、より高次元のデータも扱います。

言葉の並びや出現頻度だけをいくら解析しても、文の意味は理解できません。
言葉の背後にある、時間や善悪といった高次元で解釈を行う機能が実現できなければ、その文が何を言いたいのか理解することはできません。
自然言語処理の意味理解を行うには、言葉を、時間や空間、善悪といった次元で解釈する必要があるのです。

 

このエントリーをはてなブックマークに追加

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です