2024年11月21日(木)

イノベーションの風を読む

2017年2月2日

Siriを「なくてはならない」ものにする

 Siriから呼び出されるアプリは、ディスプレイを備えたiPhoneで利用されることを前提に作られているので、Siriは「東京駅近くのレストランを探して」といったリクエストへの答えをできるだけ読み上げようとするが、最後にはiPhoneをポケットから取り出してアプリの画面を見ることになる。

 昨年、アマゾンのスマートスピーカーEchoが、米国とドイツで150万台の販売を記録したという。リビングルームやキッチンに置かれたEchoを通して、ユーザーはSiriよりちょっと賢いアマゾンの音声アシスタントAlexaと会話することができる。音声とテキストの双方向の変換はAlexaがやってくれるが、スキルと呼ばれるAlexaのアプリは、テキストだけで応答しなければならないという制約下でつくられている。

 ただしAlexaは、まだ英語とドイツ語しか話せない。スキルを開発するための環境(Alexa Skills Kit)では、ユーザーがどのような言葉でリクエストするかを、プログラマーが力技で列挙(テキスト表記)することになっているので、多言語対応はサードパーティーにとって大きな負荷になる。言語表現やテキストの表記が多様な日本語を話すことは特に難しそうだ。

 ユーザーの言葉を正確にテキストに変換(音声認識)し、その意図を正しく理解(自然言語処理)するには、人間によるプログラミングでは限界がある。グーグルの音声アシスタントGoogle Assistantは、機械学習によってそれらの精度を向上させている。

 アプリがSiriに対応するための開発環境(SiriKit)はジャンルを限定して提供されているが、むしろアップルは、自前の標準アプリだけでSiriを「賢く」することに取り組むべきだろう。Apple Musicやマップ(道案内)などで、AirPodsだけ、音声による会話だけで快適に目的を達成できるという新しい体験は、Siriを「なくてはならない」ものにするはずだ。


新着記事

»もっと見る