2024年4月19日(金)

家電口論

2017年11月9日

何をAIに勉強させたのか?

 アマゾンは、何をAIに勉強させたのかと言うと「言語」。アマゾンはビッグデーターを使い自社のAWS(アマゾン・ウェブ・サービス)クラウドコンピューターに「言語」のマシン・ラーニングをさせたわけだ。単語、一つ一つはもちろん、組み合わせから、次のフレーズを予想し、文の意味を掴むことまで。日本語は、同音異義語が多いので難しい。省略語などは、関東が「マック」関西が「マクド」と言うように、地方でも違う。これに方言が加わると、場合によっては日本人同士でも通じないことがでてくる。それを勉強させたわけだ。

 また、文の意味を間違いなくつかむと言うことは、日本文化などの知識も持っていなければならない。例えば「お正月」が分からなければ、日本では年明けの会話が通じない。言語だけでなく文化風俗も各地域ごとに学ばせるわけだ。また会話ができないと、一方通行のコミュニケーションとなるため、話もできるようにする。しかし、電車のアナウンスのようでは、聞き取りにくいため、日本人ぽく喋ることも重要。

 アレクサの声は落ち着いた女性の声。日本でありがちなアニメ声ではなかった。落ち着いているので、どことなく有能な秘書を感じさせる。

なくてはならない声によるヒューマン・インターフェイス

 コンピューターと人間が付き合うには、ヒューマン・インターフェイス(Human Interface)が必要。ヒューマン・インターフェイスとは、人とコンピューターはどうやって情報をやり取りするのかということ。いろいろな種類がある。リモコンもそうだし、その延長線上で「スマホ」もそう。どちらかと言うと操る感じだ。

 日本では、このイメージを脱していなくて、モノ(システム)を操る場合、ディスプレイが付いたものが基本だ。

 しかし、未来はどうだろうか? 高齢化社会になった場合、若い頃のように、スマホを使えるだろうか? 答えは当然「ノー」だ。人は言葉でやり取りする。その昔、文字を知らなくて一生を終える人もいっぱいいた。その人たちは、不幸だったかというとそうではない。結婚もしたし、仕事もして、精一杯人生を生きた。

 が、しゃべれなくなったらどうだろうか?  一気に厳しくなる。その位、言葉でのコミュニケーションは人として基本中の基本のコミュニケーションでもある。人は死ぬ間際に、声は出せても、余り文字は書かない。そう書くと声、会話で、コンピューターをやり取りするのは、リモコン、スマホで動かすより、自然であることがお分かり頂けるだろうか?

 寺子屋の学習は「読み、書き、そろばん」だった。元々計算機(そろばん)のコンピューターが、「タッチパネル(スイッチ、キーボード)」「音声認識(アレクサ)」で人に近づいたと考えることもできる。

 この音声(認識)サービスが「アレクサ」だ。会話を通じて、ユーザーは情報を仕入れたり、音楽を聴いたり、家電にいろいろなことをさせることができる。

 一方、「アレクサ」は、動画プレイヤーで「Blu-ray」対応と表示されるような、「規格」のようなものでもある。この規格がデファクトとなれば、大きなビジネスになることはお分かり頂けると思う。


新着記事

»もっと見る