自然言語処理って、こんなこともわからないの？

大量の文書を読ませて学習させるのが、現在の自然言語処理の主流です。
たとえば、自動車のカタログを大量に読み込ませれば、自動車に関する膨大な知識が得られます。

「人気の車種は？」
「人気の色は？」

といった質問に回答できるようになるでしょう。
ところが、

「自動車で、アクセルの位置とハンドルの位置では、どちらが高い位置にありますか？」

こんな簡単な質問に、答えることはできません。

なぜなら、自動車のカタログのどこにも、アクセルとハンドルでは、どちらが高い位置にあるか書いてないからです。
そんなこと、書かなくても誰でも知ってるから、わざわざ書いてありません。

自動車を見たことある人なら、アクセルは足で踏んで、ハンドルは手で持って操縦することを知っているので、わざわざ、自動車のカタログに、アクセルよりハンドルが高い位置にあるとは書きません。
床より天井が高い位置にあるとも書きません。
どこにも書いていないということは、AIには答えられないということです。

今のAIに足りないのは常識だ。
でも、大量の文書で学習させれば、いずれ、AIにも常識が備わって、人と普通に会話ができるようになる。

こんな風に考える人も多いですが、この世に存在するすべての文章を学習させたとしても、「アクセルよりハンドルが高い位置にある」、「床より天井が高い位置にある」・・・
こんな簡単な常識を学習することはできないのです。

「この車は、床の下に天井がある」

こんな文章を読んでもどこがおかしいかわかりません。
他に同じ文章を見たことがないからといって、

「そんな車、絶対に存在しない」

と答えるなら、

「この車は、アクセルより高い位置にハンドルがある」

という文章を読んでも、「そんな車、絶対に存在しない」と言ってしまいます。

常識を理解できず、何が普通で、何が異常なのか区別がつきません。

これが今の自然言語処理の現状なのです。

ビッグデータを制する者が、世界を制する。
よく言われますが、これは自然言語処理にはあてはまりません。

大量の文書を与えれば、AIが人より賢くなるどころか、人とまともに会話することすらできないのです。

研究開発ブログ

ディープラーニングは、なぜ、こんな簡... 前ページ次ページ東ロボくんは、なぜ失敗したのか　「A...

“自然言語処理って、こんなこともわからないの？” への2件のフィードバック

nor より:

これは文章になる時点で重要でない事が捨てられてしまうからでしょうかね。人間でも実地での体験の少ない耳学問のみでは似たような事が起こりそうです
わざわざ文章にしない「見れば分かる」ような属性を認識させる方法が必要です
「状況を見て多様な表現で言語化するロボット」を作って大量の自然言語文章を精製させ、言語処理AIに渡すのはどうでしょうか？

返信
- 田方篤志より:
  
  コメント、ありがとうございます。
  
  わざわざ文章にしない「見れば分かる」ような属性を認識させる方法が必要です
  
  はい、おっしゃる通りです。
  ただ、「見れば分かる」を実現するのが、実は、ものすごく難しいのです。
  人は、「見れば分かる」といいますが、人は、身体を持っていて、空間の広がりといった感覚も理解して、そういった当たり前のことがあって初めて、「見れば分かる」といえるのです。
  「見たままを理解」するには、人間と同じような身体を持ち、外界の3次元空間を頭の中で認識できる仕組みがあって初めて可能なのです。
  「３次元空間を認識するってどういうこと？」も参考にしてください。
  
  「状況を見て多様な表現で言語化するロボット」を作って大量の自然言語文章を精製させ、言語処理AIに渡すのはどうでしょうか？
  
  僕が考える方法もよく似ています。人間と同じ身体を持ったロボットが３次元空間で経験することで、外界に存在する机や椅子などの物体を認識し、頭の中にデータとして溜めていきます。
  次に、辞書などを読むことで、頭の中に溜めたデータに「机」や「椅子」といった名前を対応させていきます。
  これは、人間の赤ちゃんが行っていることと同じことですね。

自然言語処理って、こんなこともわからないの？

“自然言語処理って、こんなこともわからないの？” への2件のフィードバック

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル