青山学院大学シンギュラリティ研究所の設立を記念した講演会の内容を、6回にわたり掲載していく本連載。第5回は、「AI 開発で明らかになった”日本語の正体”」と題して、シーマン人工知能研究所所長の斎藤由多加氏が、6月24日に講演した内容を紹介する。
シンギュラリティの「ラスト1マイル」と言われているのが、日本語の部分です。シンギュラリティに欠かせないのは、AIによるディープラーニングですが、ディープラーニングの結果をどう日本語化するか、そして口語の日本語をどうAIに取り込むか。また、AIが人間の言っていることをほんとうに理解しているか、「会話の自然性」について情熱を込めて研究しているところです。
音声認識ゲーム開発で分かった「日本語の曖昧さ」
私の職業はゲームクリエーターです。人面魚の「シーマン ~禁断のペット~」(1999年7月発売)というゲームを作っていましたが、リリースが19年前なので、開発していたのはもう20年以上前になります。このゲームソフトは音声認識を使ってプレイするタイプだったので、私は日本語の会話について研究せざるを得ませんでした。この当時の技術では、「人工知能」ではなく、「人工無能」の発展系にしかなりませんでした。人工無能とは人間と会話することを目的としたプログラムです。音声認識のゲームは現在でもあまりなく、このゲームはSEGAで発売され、出荷率No.1などの記録を作っていくことになります。
「二人称」の問題に突き当たる
シーマンは会話するときにユーザーの事を「おまえ」と呼びます。シーマンが生意気だと言われる一つの理由が、この「お前」という呼び名です。ではなぜ、相手のことをおまえと呼ばせることになったのか、それが本日の議題につながります。日本語には二人称を的確に目上の人に伝える言葉がありません。それが日本語の特徴であり、困ったところでもあります。千鳥(お笑いコンビ)が登場するスマートニュースのCMで「貴様は?」と問いかけていますが、文字にすると貴様、相手を敬っていますね。でも声に出して言うとけなしているように聞こえます。
例えば私が先輩の小平プロデューサーを呼ぶときには、「小平さん」と名前を呼ばなければなりません。しかし、これは当時のプログラムでは不可能で、シーマンにユーザーの名前を呼ばせることができなかったので「おまえ」と呼ばせたわけです。現在、親しい間柄で相手の事を呼ぶときは「おまえ」、すこし距離感がある場合には「きみ」ぐらいしか選択肢がありません。「あなた」と言われると、少し突き放された感じがあります。
それからもう一つ厄介なのが省略です。日本語の会話には省略が多い。その後、Pepper君などが登場しますが、これらの問題に突き当たって日本語の会話がなかなかうまくいかない。エンジニアたちはだんだん日本語と向き合うことをやめてしまい、GoogleやAmazon、Appleなどの賢い人たちが日本語に関してもどうにかしてくれるだろうと、期待して待っている状態でした。そこで私は、1年半前に「シーマン人工知能研究所」(http://seaman.ai)を作りました。シーマンの開発で培ったノウハウで日本語口語の会話エンジンを開発し、無償で提供したいと考えています。