日本語の「省略」にどう対応するか
野球というゲームで選手がおこなっている動きは、わずか4つの動作です。投げる、打つ、走る、捕る。これらの組み合わせで監督の采配が伝わってきます。その監督の偉大さも分かります。ゲームにはそんな文脈を作る力があります。将棋の羽生名人の言葉ですが、相手の弱点を突く対局もあれば、相手を称える対局もあるそうです。その道を究めれば究めるほど、相手が一手を指すだけで、その人の性格まで分かってくるに違いありません。それがゲームというものです。
それでは言語の場合はどうでしょうか。結婚式のスピーチで朗々と語る人がいますが、そんなスピーチは退屈で心に響きません。理由を考えてみると、論文のように読み上げられるスピーチには観客が介入する余地がありません。干渉できないわけです。一方、面白いスピーチには隙があります。文語と口語の違いもあると思います。口語はセンテンスが短く、主語、述語がポンポン入ってきます。これが論文調だと主語と述語の間に隙がなく会話に入っていけない。口語には省略が欠かせません。日本語のエンジンはこの省略の部分をきちんと補完する能力が要求されます。
言葉をシンプルにするとリズムが生まれます。女子高生同士、築地の競り、株式市場。どの会話も省略され、暗号化され、部外者が聞いても意味が分かりません。省略がなければ強調もできません。省略によって高度なコミュニケーションが生まれているのです。これをAIに教えようとしても、会話の文例が少ないので難航しています。こうした会話のビッグデータを得るためにいま、各社が「Siri」やスマートスピーカーを発売し、必死になってそのサンプルを集めているところです。ただ、これはマシンと人間の会話で、本当に必要なのは人間同士の会話のサンプルです。我々も日本語の会話の教師データを収集してディープラーニングに利用したいと考えています。
世界初の「相づちを打てるAI」の完成を目指す
世界中にある会話のできるAIに、「今日はやる気が出ないなあ」と話しかけても相づちを打てるものはありません。ビッグデータの中に答えがないので、ディープラーニングは使えません。質疑応答システムは正解という存在が曖昧な議論には答えられないのです。相づちを打つには、別のアプローチが必要になります。いつ生まれて、いつ失恋したのか、好きな食べ物、嫌いな物は何か、などのパーソナルデータを読み込むことが不可欠になります。我々はそれらと向き合った日本語音声会話システムの開発をおこなっています。数年あれば、普通に会話ができる日本語エンジンを完成させることができると考えています。
▲「WEDGE Infinity」の新着記事などをお届けしています。