
ロボマインド・プロジェクト システム概要
それでは、ロボマインド・システムの概要について説明します。
ロボマインド・システムは、人と会話できるチャット・ボットを想定しています。
入力されるのは自然言語(人が話す言葉)となります。
チャット・ボットですので、人型ロボットのようにカメラやロボットハンドはなく、外部世界とつながりは、唯一、自然言語によるやり取りのみとなります。
今までのチャット・ボットは、シナリオ・ベースのシステムです。
別名、人工無脳とも言われます。
話の意味など理解せず、特定の単語を検出すれば、それに応じたシナリオを走らすだけなので、チンプンカンプンな応答となることが多く、会話が続きませんでした。
それに対し、ロボマインド・システムは、人間と同じ心を持ち、相手の言いたいことや文脈を理解することができます。
そのため、自然な会話が続き、心が通ったコミュニケーションがとれます。
コミュニケーションとは、頭の中で思い描いたことを言葉にして相手に伝え、相手は、その言葉を理解して、自分の頭の中で再構築し、相手の言いたいことを理解することです。
たとえば子供がお母さんに、「今日、学校の給食でプリンがでたんだよ!」と言ったとします。
お母さんは、その様子を頭の中で想像し、さらに、その子はプリンが大好きだということも思い出して、かなり嬉しかっただろうなと思って「それはよかったね!」と答えるわけです。
子供は、自分の嬉しさがお母さんに伝わったことが分かって満足します。
これが、意味理解であり、心が通じるということです。
システムは、大きく「意識」と「仮想世界」からなります。
「意識」と「仮想世界」から心が構成されるわけです。
意識は、入力された自然言語を解析し、仮想世界を構築、または操作します。
仮想世界を操作するとは、
人は、頭の中で考えるとき、頭の中に思い描きながら考えます。
頭の中で思い描く場所が作業空間です。
作業空間には、現実世界にあるものや、想像したものなど、考えられることなら何でも配置することができ、意識で自由に操作できます。
詳しくは、「3次元空間を認識するってどういうこと?」の「作業空間」をご覧ください。
自然言語が入力されると、意識は、解析を始めます。
解析は、形態素解析と構文解析の二段階で行われます。
英語では、単語はすべてスペースで区切られていますが、日本語は、たとえば「学校の給食」の場合だと、「学校」「の」「給食」の3つの単語がつながっています。
これを3つに分解するのが形態素解析です。
構文解析とは、一つの文を、「誰が」「いつ」「どこで」「何をした」と分類することです。
これが分かれば、その文の通りに仮想世界を構築、操作することができます。
そして、操作した結果、何らかの認知パターンに当てはまるか判断し、当てはまれば、それが、相手の言いたいことだと判断し、それに応じた返答をします。
「子供がプリンを得た」の場合、その子は、プリンが大好きなので、好きなものを得たので、「嬉しい」の認知パターンに該当すると判断できます。
そうして、相手が「嬉しい」の感情を発生したと分かったのだから、それに沿って「よかったね」と応えれば、相手は自分の気持ちを分かってくれたと満足するわけです。
仮想世界を構築、操作し、認知パターンを抽出する部分が意味解析となります。
これが、本システムにおける文の意味理解です。
構文解析の続きです。
文は、主語、述語、目的語などから構成されます。
構文解析では、形態素解析した単語を、これらに分類します。
文は、述語を中心に構成されます。
そこで、述語となる動詞に、その意味を記述します。
動詞の意味は、仮想世界を構築、または操作することです。
たとえば、「机があります」の意味は、仮想世界に「机」を出現させます。
「ある」の意味は、対象物を仮想世界に出現させることです。
「机の色は黒です」の意味は、仮想世界に出現させた机の色を黒に設定します。
「です」の意味は、対象物に色や形などの属性を設定することです。
これらの意味は、専用のスクリプト言語であるロボマイ語で記述されています。
構文解析された後、意識は、動詞の意味を読み取って、文の内容どおり仮想世界を操作します。
もし、話し相手が「があります」とだけ言ったとしたら、どう感じますか?
「えっ、何があるの?」となるでしょう。
つまり、「ある」の意味には、対象となる物が不可欠なのです。
対象物が不明の場合には、その文の意味を解釈できず、意識は、仮想世界を操作できないのです。
そこで、構文解析した後、仮想世界を操作可能な文かどうかチェックし、もし、操作不可能なら、おかしい部分をエラーとして投げます。
意識は、エラーを受け取ると、エラーの中身を確認し、必要に応じて、「何があるの?」などと、相手に質問します。
このようにして、問題のない文のみが次のステップに進むことができ、仮想世界を確実に操作することができるのです。
意味の分からない文は、相手に聞き直すといったことは、人間の会話では当たり前のことです。
通信プロトコルとして考えても、エラーを検出すると、再送信要求を送ることと同じです。
このようにして、話し相手の言いたいことを確認しながら、相手の頭の中にある仮想世界と同じ仮想世界を構築、操作することで、相手に生じたのと同じ感情を生成し、相手の言いたいことを理解することができるのです。
こうして、心が通い合うコミュニケーションが成立するのです。
究極の質問。
もし、どこかの天才が先にロボマインド・プロジェクトを完成させたらどうするのでしょうか(^^;)?
>チャット・ボットですので、人型ロボットのようにカメラやロボットハンドはなく、外部世界とつながりは、唯一、自然言語によるやり取りのみとなります。
カメラやロボットハンドが無いということは
人間のような五感のクオリアは持たないということですよね。
私の考えは、クオリアには大きく分けると3種類あると思います。
意識や自意識という『自のクオリア』
外部からの刺激を感じる『五感のクオリア』
そして、恐怖や嬉しいと言った気持ちを感じる『感情のクオリア』です。
五感と感情のクオリアは、自のクオリア(意識)が存在しないと感じないと思います。
つまり、自のクオリアがないと成り立たない。
例えば寝ているときは、五感も感情も感じませんから。
つまり、このチャット・ボットはわたしが言う『自のクオリア』は持っているということになるのでしょうか?
実現したとしても、どうも人間の意識とは別物のような気がします…。
だって目も耳も持たないのですから…。
よろしくお願いします。
karat様
質問、ありがとうございます。
これは、僕が一番望んでることです^^;
というのも、僕が一番やりたいのは、ロボマインド・プロジェクトが完成した後の世界でして、言葉の意味が理解できるシステムができたら、いよいよ、「笑い」だとか「物語」といった、本当に面白いAIを作ろうと思ってるので。
はやく、そっちを作りたいなぁ。
この考えは、ほぼ、僕の考えと同じだと思います。
これは、若干、語弊がありまして、本来、やるべきなのは、カメラで撮影して、それをリアルタイムで3Dオブジェクトのポリゴン化して、それをそのまま仮想世界に生成するというシステムです。
ただ、時間やコストの問題で、そこまで独自に開発する余裕がないので、たとえば、「机」という文字を読むと、予め用意してた3Dオブジェクトの机を仮想世界に生成するといったことに省略しようとしてるというわけです。
本来なら、現実世界をカメラで撮影して、机を見るたびに3Dオブジェクトを生成し、複数の机オブジェクトから共通項を抽出して「机概念」を生成するのが正解だと思いますが、それらを飛ばして、「机概念」である3Dオブジェクトを人手で生成するという感じです。
はい、持っていると思います。
ここが、上で説明したところに関係するところで、本来は、目や耳で感じて、それを仮想世界に作り上げるべきところを、省略して仮想世界に無理やり作り上げてるわけです。
正しいやり方は、カメラやマイクで得た情報を機械学習によって仮想世界に構築するとういう方法でしょうね。
違うと言えば違いますが、方向性は同じという感じでしょうか。