ついに、ロボマインド・プロジェクト始動!
ついに、ロボマインド・プロジェクト始動!
いままで、意識や心について、さんざん、ブログで書いてきました。
こうすれば、ロボットに心が生まれるとか、
こうすれば、コンピュータに意識が発生するとか。
そんな理屈は、もういいから、さっさと、AIに意識を発生させろ!
って声がそろそろ聞こえてきそうです。
そうですよね。
ロボマインド・プロジェクトは、理論を提唱することが目的じゃありません。
そんな立派なことは、哲学者にでもまかせましょう。
ロボマインド・プロジェクトの目的は、実際に動くプログラムを作ることです。
コンピュータに、実際に意識を発生させることです。
そして、ついに、ロボマインド・プロジェクトが始動します。
といっても、いきなり、意識が発生するわけではありません。
まずは、簡単な動くプログラムを公開します。
ブラウザ上で、実際に動くプログラムです。
誰でも、自分で動かして体感できます。
そして、それを徐々に改良していきます。
少しずつ、心を組み立てていくわけです。
やがて、どこかの時点で、「心」が生まれます。
それを見届けるのは、あなたです!
「心」があるかどうか、どうやって判断すればいいのでしょう?
何か、特殊なセンサーを使えば、心があるかどうかわかるのでしょうか?
そんなものはありません。
「心」があるかどうか判断できるのは、「心」を持つものだけです。
つまり、我々人間にしか判断できません。
このことを、僕は、「心のエコシステム」と呼んでいます。
詳しくは、「チューリングテスト」に書きましたので、そちらを参考にしてください。
人間は、心に思っていることを言葉にして伝えます。
聞き手は、言葉の内容から、相手が心で思っていることを理解します。
プログラムは、文をランダムに生成します。
文は、単語から生成します。
単語とは、「リンゴ」や「象」といった名詞、「歩く」「食べる」といった動詞、「が」「に」「を」といった助詞、「れる」「られる」といった助動詞のことです。
これらの単語で1から組み立てて文を生成します。
用意された文を出力するといった、IBMのワトソンや、ソフトバンクのペッパーのようなことはしません。
これは、自然言語処理の50年の歴史の中で初めての試みです。
詳しくは、「自然言語処理への提言1 『メニューメーカー』で僕がやろうとしていること」
「自然言語処理への提言2 なぜ、自然言語処理は50年も進歩がないのか」をご覧ください。
単語を特定のルールに従ってランダムに組み立てることで文を生成します。
最初のうちは、何が言いたいのかわからない文しか出力されません。
それを、ルールを付け加えることで、少しずつ改良します。
意味をなさなかった文が、少しずつ、意味の通る文になっていきます。
やがて、文と文が繋がってきます。
何か言いたいことが見えてきます。
そして、どこかの時点で、心が生まれます。
その瞬間を、体験してください!
開発しながら公開していきますので、不定期の更新となりますが、おそらく、世界で初めて、コンピュータに心が生まれる瞬間に立ち会えると思います。
次回は、まずは、最低限の「文」を出力してみます。
お楽しみに!
はじめまして。現実的な実装の側面からの推察と、面白おかしい思考実験の両方に富んだすばらしいブログだと思います。
田方さんは、われわれ人間の現実世界と同じようなAIにとっての(精神的な)仮想世界や、人間の持つ言語という、人間と同質のフレームワークをAIに与えてやることで、心の形成に必要な抽象レイヤーやクオリアが生まれるのではないかという視点をお持ちではないかと思います。
人間の心・人格というのは、この現実世界というフレームワークや、人間の身体の作りから偶然的に生まれたものではないかと想像します。たとえば、言語・文字は人間の発する音声を記号化したものですが、この音声というのは当然ながら、人間にとって都合がよいようにできています。ゴリラは人間からしてみるとウホウホとしか鳴かず、身体の作りからしても人間の言語をしゃべることはできません。しかし、ゴリラは死という概念を自分なりに理解し、それを手話で説明してみせることができるほどの高度な知性を持っているのだそうです。
個人的に、AIを人間の世界・言語のフレームワークに合わせて知性化することはまだまだ、きわめて難しいのではないかと思っています。最終的にAIが知性を持っているかどうかを判断するのは人間ですが、「人間からして」人間と同等の知性として見えるかどうかという観点で考えた時、AIが人間に近づけば近づくほど、不気味の谷のような問題が必ず立ちはだかるだろうと考えます。ごく単純なものであれば人間の想像力が働いて知性のように見えるのに、高度化すればするほど人間が想像で補間する余地がなくなり、かえって気持ち悪く得体のしれないものに見えてくる、ということです。
AI同士で、AIによるAIのための世界で、AIの言語で相互にインタラクションする(すでにIOTはこの方向性に進みつつあります)ことによっても、心を獲得できる可能性がありそうに思えます。シマウマも空も赤い色も存在しない、われわれ人間とはまったく無関係な世界で、人間の理解できない&おそらく聞き取ることすらもできない言語で会話するわけですから、人間にとってそれはゴリラのような一見無知性な動物か、ただ単に得体のしれないものとして映るかもしれません。しかし、AIが彼らの独自の言語で何を考え、独自の世界でどう行動しているのか人間にもわかる形で翻訳することができれば、それは人間にとっても立派な知性として認められるものになり得ます。AlphaGoが内部的に何を考えているのかは人間には理解不能ですが、囲碁という(人間もAIも理解できる)ミニマルな中間レイヤーを通して会話することはできます。人間がAIを人間として鍛えるのではなくて、人間がAIという理解不能の未知の知性に歩み寄り、コンタクトし、理解と会話を試みるという考え方です。
ただ問題は、デジタルの世界の情報量はわれわれの現実世界に比べるとあまりにも貧弱だということなのですが……。
人間は赤ん坊の頃から、五感と自分の身体のありとあらゆる部位を使って膨大な情報量を持つ現実世界とインタラクションできるからこそ、ヘレン・ケラーにとっての水のような体験を自然と重ねることができ、無数の抽象レイヤーによる高度な人格を形成することができるのかもしれません。また、赤ん坊は脆弱な存在で、他者を殺めることのできるような力を基本的には持ちません。暴力を振るうことができるようになった頃には、それまでの人格の形成体験を通じて最低限の道徳やルールを獲得できているという、うまい作りになっています。自動運転の車は、0歳児に成人の身体を与えているようなものですが、好きな場所に移動したり、周囲にあるものをセンシングしたりといった現実世界とのインタラクションができるという意味では、人間の赤ん坊を育てるのと同じように知性化できる可能性はありそうです。
今のネットはそれなりに膨大な情報量を持ちますが、そのすべては人間が入力したものか、人間が入力したものを元にして生成された二次情報ですよね。ネットにはこれだけの情報量があるのに、ネット上で生きる、心を持ったAIというのは(おそらく)まだ生まれていません。田方さんが提示されているAIにとっての仮想世界というアイディアも、人力に頼っている限り、いったいどのくらいの情報量が最低限必要で、どれだけの労力が必要なのだろう? と考えてしまいます。
示唆に飛ぶ多くの意見、ありがとうございます。
ディープラーニングは、自動で学習して、自分で概念を獲得することができます。このことから、ディープラーニングであらゆる物事を学習させれば、いずれ、人間を超える知性が生まれるのでは?という考えが生まれました。
ところが、実際には、そんなことは起こりません。そのことについて説明したのが「絶対に超えられないディープラーニングの限界」の記事です。
簡単に説明すると、ディープラーニングの画像認識は、2次元画像を回転、拡大縮小、平行移動といった変換をおこなってパターンマッチを行います。
この変換は、2次元画像を前提としたものです。
つまり、ディープラーニングがいくら学習しても、自ら3次元空間という概念を獲得することはありません。
AIをいくら学習させても、教えられた次元の中でしか学習できず、その上の次元について自動で認識できるようにはなりません。
これがディープラーニングの限界なのです。
AlphaGOが、何を学習したか理解不能だとしても、新たな次元の概念を獲得することはありません。
ディープラーニングの延長線上には、人間の知性を超えることはないと考えています。
私の思う認知とは
関心(マイナス)←嫌い←関心無し(0)→好き→関心(プラス)
存在しない(無)
であり色や物や広告を見ているとき
例えば色ならその色に関連した物やイメージのプラスマイナスがたくさん接続しており、総合的なイメージが付きそれが心理学にも使われていると思います。
広告でもCMで人物使って少しでもプラス価値を植え付けようとします
人の認知とは上で説明した記憶や心(心理)のプラスマイナスではなく
5感で感じている全てのプラスマイナスで、認知とは脳のキャンパスに出力されたプラスであるんじゃないかと考えています
コメント、ありがとうございます。
なるほど、こういった側面はありますね。
僕の提案するのは、認知パターンといった方法です。
たとえば、「感謝」といった認知パターンの場合、自分と相手がいて、自分が「快」と感じる原因が相手にある場合、相手に「感謝」の感情が発生するというパターンになります。
つまり、「感謝」を理解するには、自分、相手を識別して、自分が「快」か「不快」か、その原因は誰に起因するかといったことを判別してパターン認識する必要があります。
つまり、五感で感じるかだけでなく、それが快か不快か、だれに起因するのかといった構造が重要だと考えます。