歴史を変える可能性を秘めたアマゾンエコー　Wedge ONLINE(ウェッジ・オンライン)

何をAIに勉強させたのか？

　アマゾンは、何をAIに勉強させたのかと言うと「言語」。アマゾンはビッグデーターを使い自社のAWS（アマゾン・ウェブ・サービス）クラウドコンピューターに「言語」のマシン・ラーニングをさせたわけだ。単語、一つ一つはもちろん、組み合わせから、次のフレーズを予想し、文の意味を掴むことまで。日本語は、同音異義語が多いので難しい。省略語などは、関東が「マック」関西が「マクド」と言うように、地方でも違う。これに方言が加わると、場合によっては日本人同士でも通じないことがでてくる。それを勉強させたわけだ。

　また、文の意味を間違いなくつかむと言うことは、日本文化などの知識も持っていなければならない。例えば「お正月」が分からなければ、日本では年明けの会話が通じない。言語だけでなく文化風俗も各地域ごとに学ばせるわけだ。また会話ができないと、一方通行のコミュニケーションとなるため、話もできるようにする。しかし、電車のアナウンスのようでは、聞き取りにくいため、日本人ぽく喋ることも重要。

　アレクサの声は落ち着いた女性の声。日本でありがちなアニメ声ではなかった。落ち着いているので、どことなく有能な秘書を感じさせる。

なくてはならない声によるヒューマン・インターフェイス

　コンピューターと人間が付き合うには、ヒューマン・インターフェイス（Human Interface）が必要。ヒューマン・インターフェイスとは、人とコンピューターはどうやって情報をやり取りするのかということ。いろいろな種類がある。リモコンもそうだし、その延長線上で「スマホ」もそう。どちらかと言うと操る感じだ。

　日本では、このイメージを脱していなくて、モノ（システム）を操る場合、ディスプレイが付いたものが基本だ。

　しかし、未来はどうだろうか？　高齢化社会になった場合、若い頃のように、スマホを使えるだろうか？　答えは当然「ノー」だ。人は言葉でやり取りする。その昔、文字を知らなくて一生を終える人もいっぱいいた。その人たちは、不幸だったかというとそうではない。結婚もしたし、仕事もして、精一杯人生を生きた。

　が、しゃべれなくなったらどうだろうか？　一気に厳しくなる。その位、言葉でのコミュニケーションは人として基本中の基本のコミュニケーションでもある。人は死ぬ間際に、声は出せても、余り文字は書かない。そう書くと声、会話で、コンピューターをやり取りするのは、リモコン、スマホで動かすより、自然であることがお分かり頂けるだろうか？

　寺子屋の学習は「読み、書き、そろばん」だった。元々計算機（そろばん）のコンピューターが、「タッチパネル（スイッチ、キーボード）」「音声認識（アレクサ）」で人に近づいたと考えることもできる。

　この音声（認識）サービスが「アレクサ」だ。会話を通じて、ユーザーは情報を仕入れたり、音楽を聴いたり、家電にいろいろなことをさせることができる。

　一方、「アレクサ」は、動画プレイヤーで「Blu-ray」対応と表示されるような、「規格」のようなものでもある。この規格がデファクトとなれば、大きなビジネスになることはお分かり頂けると思う。

歴史を変える可能性を秘めたアマゾンエコー

何をAIに勉強させたのか？

なくてはならない声によるヒューマン・インターフェイス

新着記事

特集