AIはシンギュラリティの夢を見るか?

2017年7月4日

»著者プロフィール
閉じる

川手恭輔 (かわて・きょうすけ)

コンセプトデザイン・サイエンティスト

1990年代から、大手メーカーでインターネットサービスの企画・開発・運用を手がけ、自ら立案したグローバルなサービスを複数立ち上げた経験を持つ。その1つは、サービスのデザインでグッドデザイン賞を受賞した。コンピューターサイエンス関連の翻訳本も多数ある。

 「10秒タップする代わりに、スマホと60秒話したいとは思わない」。そう考えている人は多いようです。

(iStock)

 クリエイティブ・ストラテジーの調査(米国)に、iPhoneとAndroidスマートフォンのユーザーのほとんどが、「ヘイ、シリ」や「オッケー、グーグル」などと呼びかけたことがあると答えています。しかし、それぞれの70%と62%は、その機能をごく稀にしか使っていないと告白しています。そして、それらの音声アシスタントと公共の場で会話する人は、6%とさらに少なくなります。

 車の中での音声アシスタントの利用度が高いことは理解できますが、iPhoneユーザーの62%に対し、Googleマップと親和性の高いAndroidスマートフォンのユーザーでは37%と低くなっているのは意外です。しかし、Androidスマートフォンでは、「オッケー、グーグル」と呼ぶことで音声アシスタント(Google Assistant)を起動できるようになったので、今後、利用度は増加するでしょう。

 公共の場での利用度が低いのは、スマートフォンと話すことが恥ずかしいからだと思うかもしれません。

 しかし、クリエイティブ・ストラテジーは、音声アシスタントとの会話に不快感を感じているからだと推測しています。効率が悪いから「10秒タップする代わりに、スマホと60秒話したいとは思わない」のです。それは、公共の場で、iPhoneの音声アシスタント(Siri)を使う割合が、3%と低迷している理由でもあると考えているようです。公共の場で大声で携帯電話で通話することは、米国では普通のことです。逆に、日本人が通話口を手で覆ってヒソヒソと話す姿を奇異に感じるようです。

 なぜ、音声アシスタントとの会話に、特に公共の場で不快感を感じるのでしょうか。

 音声アシスタントは、人間の音声をテキストに変換して、その意図を解析します。音声をテキストに変換する音声認識の精度は、ここ数年の機械学習の進歩によって飛躍的に向上しました。しかし、テキストの意図を理解して、ユーザーの質問やリクエストにこたえる自然言語処理に関しては、まだ「自然」と言えるレベルには到達していません。

 iPhoneでSiriに「なにができますか」と尋ねると、アップル謹製のアプリと、Siriに対応した他社のアプリの一覧が表示されます。他社製アプリの少なさも問題ですが、それぞれのアプリについて「たとえばこのように尋ねてください」と示された例(ルール)が、ユーザーが不快感を感じる理由を表しています。

 ルールを忘れて言い方を間違えたり、伝えるべき情報が不足していたりすると、音声アシスタントは、こちらの意図と異なった答えをしてどこかへ消えてしまいます。もう一度「ヘイ、シリ!」と呼んで、最初からやり直さなければなりません。公共の場で大声で通話することが普通のことであっても、スマートフォン相手に格闘している姿は晒したくないでしょう。家の中のようなプライベートな空間と違って、笑って済ます心理的な余裕もないかもしれません。

関連記事

  • PR
  • 新着記事

    »もっと見る