自然言語処理って、こんなこともわからないの?

自然言語処理って、こんなこともわからないの?

2018.04.03
このエントリーをはてなブックマークに追加

大量の文書を読ませて学習させるのが、現在の自然言語処理の主流です。
たとえば、自動車のカタログを大量に読み込ませれば、自動車に関する膨大な知識が得られます。

「人気の車種は?」
「人気の色は?」

といった質問に回答できるようになるでしょう。
ところが、

「自動車で、アクセルの位置とハンドルの位置では、どちらが高い位置にありますか?」

こんな簡単な質問に、答えることはできません。

なぜなら、自動車のカタログのどこにも、アクセルとハンドルでは、どちらが高い位置にあるか書いてないからです。
そんなこと、書かなくても誰でも知ってるから、わざわざ書いてありません。

自動車を見たことある人なら、アクセルは足で踏んで、ハンドルは手で持って操縦することを知っているので、わざわざ、自動車のカタログに、アクセルよりハンドルが高い位置にあるとは書きません。
床より天井が高い位置にあるとも書きません。
どこにも書いていないということは、AIには答えられないということです。

 

今のAIに足りないのは常識だ。
でも、大量の文書で学習させれば、いずれ、AIにも常識が備わって、人と普通に会話ができるようになる。

こんな風に考える人も多いですが、この世に存在するすべての文章を学習させたとしても、「アクセルよりハンドルが高い位置にある」、「床より天井が高い位置にある」・・・
こんな簡単な常識を学習することはできないのです。

「この車は、床の下に天井がある」

こんな文章を読んでもどこがおかしいかわかりません。
他に同じ文章を見たことがないからといって、

「そんな車、絶対に存在しない」

と答えるなら、

「この車は、アクセルより高い位置にハンドルがある」

という文章を読んでも、「そんな車、絶対に存在しない」と言ってしまいます。

 

常識を理解できず、何が普通で、何が異常なのか区別がつきません。

これが今の自然言語処理の現状なのです。

 

ビッグデータを制する者が、世界を制する。
よく言われますが、これは自然言語処理にはあてはまりません。

大量の文書を与えれば、AIが人より賢くなるどころか、人とまともに会話することすらできないのです。

 

このエントリーをはてなブックマークに追加

コメントを残す