Book

なぜ人工知能は人と会話ができるのか|三宅 陽一郎|AIはどうやって人の言葉を理解しているのか?

AIの話題に事欠くことがない現在、人の言葉を理解できるようになったAIは接客や窓口業務、ユーザーサポートなど活躍の場が広まっています。AIはどうやって人の言葉を理解しているのかに焦点を当て解説します。

記号化されていない画像を見分ける

大抵の人工知能は、言語化されたデータ、言語化された知識から出発します。ところが一方で、「言語化しつつある部分」(シニフィアン/シニフィエの境界)というのが実は一番難しい知能です。つまり、生き物が精神的な意味で世界に裸のまま投げ出されれば、どう世界を解釈していいのかという不安でいっぱいになるように、人工知能はいきなり世界に投げ出されても、世界をどう分節していいかわからないのです。赤ちゃんは、ゆっくりと、最初はお母さんと自分という2つの言葉だけですが、やがて「ベッド」「お父さん」「おもちゃ」「ミルク」など、4つ、5つ、6つと言葉を覚えることで、世界を分割する個数が増えていくのです。そこで、古典的な人工知能は、この言語化した後の問題を取り上げます。つまり、自然言語処理を行い、言語化された記号同士の関係に着目します。IBMワトソンは基本的に記号しか扱いませんし、IBMワトソンは世界中のWikipediaを学習しているのですが、記号以外のことは何も知らない、つまり、リンゴといったら実際のリンゴではなく、「リンゴ」は「甘い」というような言葉同士の関係しか知りません。 しかし、記号同士の関係を人間では及びもつかないほど大量に持っているのが、IBMワトソンの素晴らしいところです。検索エンジンが、言葉を入れると関連するサイトのリンクを教えてくれるように、IBMワトソンは、ある言葉を入れるとそれに関する言葉を教えてくれます。 ですから、「甘くて」「赤くて」「果物」と入れると、「リンゴ」「プラム」「さくらんぼう」など候補のリストを返してくれるわけです。 五感で味わう世界は、人工知能が実は取り残されているところで、この部分を探求しているのが、人工知能のもう1つの潮流「ニューラルネットワーク」です。 たとえば、「リンゴ」の絵と「白鳥」の絵を見てどちらがリンゴなのか、というような、言語化される以前の画像情報を入れて分類するということは、これまで踏みこまなかった世界の分節化=言語化のプロセスそのものに向かって人工知能が発展できるということなのです。

記号化、言語化しているものを見分けられるのはわかるが、それを発展させる技術が進みつつある。言語化のプロセスそのものをAIが担う訳だがそうなってくるとAIにデータを食わせる作業自体もAIが行うように。一番面倒な作業を効率化できる画期的な発見だ。

人間と話すキャラクターたち

「エージェント指向」というコンセプトがあります。「エージェント」とは、ある役割を以て自律的に活動する人工知能のことをいいます。特に「自律型エージェント」といった場合には、自分自身で意思決定を行うエージェントのことをいいます。 デジタルゲームのキャラクターは、1980〜1990年代までは「スクリプティッドAI」(Scripted AI)といって開発者の準備したスクリプトに沿って動いていましたが、2000年頃から、ゲームの複雑度が増したせいもあり、与えられた役割のために、自分で情報を集め、自分で意思決定を行い、自分で行動をデザインする「自律型エージェント」に進化してきました。 現実空間におけるエージェント指向は、主にインターフェースとしてエージェントを用いよう、というところにあります。つまり、ソフトウェア自体であれば、文字や音声だけのインターフェースで良いところを、キャラクターの姿をしたエージェントを介在させることで、ユーザー体験(UX)をより良いものにしよう、というアプローチです。このアプローチは「擬人化エージェント」(=キャラクター)とも呼ばれます。

人間と会話ができるもので印象に残っているのはシーマンというゲーム上に出てくる人面魚。その独特なキャラクターが受けてちょっとした話題になったのだが、それの進化系が現在のAIと言えるだろう。

デジタルサイネージにおけるエージェントたち

「デジタルサイネージ」とは電子掲示板のことです。駅中の柱やデパートの壁によく配置されています。また自動販売機の表面も電子掲示板になりつつあります。 デジタルサイネージは従来の紙のポスターに比べて動作を展開できること、そしてインタラクティブに動作させられることが特徴です。そこでキャラクターをそこに登場させてユーザーに話しかける試みが行われています。 またデジタルサイネージはカメラを搭載していることもあります。そこで、立ち止まった人の顔を認識し、性別・年齢などを確認して、そのプロフィールにあった宣伝の仕方、商品を提供することが可能になります。また東京ジョイポリス(セガ)では、リアルタイムにモーションを認識できる「Kinect」(マイクロソフト)を使って、身振り手振りでデジタル世界やキャラクターとインタラクションできるエンターテインメントが展開されています。

デジタルサイネージ、最近ではみることが多くなってきていますよね。年齢性別などを元に最適な広告を表示するわけですが、そのうちスマホなどと連動してグーグルの検索履歴とかの情報を元に広告を表示して気持ち悪がられるといった現象も起こるかも。

人工知能がもたらす便利さを人との会話という点で掘り下げた書籍。どのようにして人の言葉を理解して会話を成り立たせているのかがわかり、よりAIを身近に感じられるようになる書籍です。

※この書籍はKindle Unlimited読み放題書籍です。月額980円で和書12万冊以上、洋書120万冊以上のKindle電子書籍が読み放題になるサービスが初回30日間無料となっております。PCの方はサイドバーのリンクより、スマホの方は下の方へスクロールしていただければリンクが貼ってありますので興味のある方はどうぞ。なお一部の書籍はキャンペーンなどで無料になっていて現在は有料となっている場合もありますのでその場合はあしからず。

【サブスク】 Kindle Unlimited

Kindle Unlimitedの詳細はこちら

僕が利用している読書コミュニティサイト

【本が好き】https://www.honzuki.jp/

【シミルボン】https://shimirubon.jp/

-Book
-, , , ,

© 2024 51Blog Powered by AFFINGER5