日本人が苦手としてきた言葉の壁が、人工知能(AI)をつかった最新技術による克服されようとしている。AIによる翻訳、同時通訳技術を開発している国立研究開発法人情報通信研究機構(NICT)はこのほど、日本記者クラブで音声翻訳アプリ「ボイストラ」を使った日本語、英語、中国語による自動翻訳の実演を行った。研究開発を行っている隅田英一郎NICTフェローは「東京オリンピックまでには、いまの『ボイストラ』の翻訳の精度を高めて、世界最高の翻訳アプリを作り、あらゆる場所で音声翻訳が使われるようにしたい」と意気込みを述べた。
オールジャパンで開発
日本で音声翻訳が始まったのは1986年だったが、当時は決まった型の文章しか翻訳できず、文法に沿ってないものは翻訳できにくかった。翻訳された音声もロボットがしゃべるような声で、違和感があった。その後93年にできた音声通訳システムは1文を翻訳するのに30秒もかかり、実用化するには程遠いものだった。
2008年には改良して翻訳機を作ったものの、弁当箱サイズと大きかったため利用されなかった。「ボイストラ」はそれまでとは異なるコンセプトで2010年8月からスマートフォン搭載アプリ用に開発を進めた同時通訳技術で、「アイフォン」「アンドロイド」の両タイプのスマホに使えるようにした。14年からは国家プロジェクトとなりグローバルコミュニケーション計画になり、通信、電機メーカーなどから40人の優秀なエンジニアが参加したオールジャパンで開発を加速させてきた。5年前の段階の「ボイストラ」は誤訳が目立つなどしたが、この1、2年のAIを活用したニューラルネットワーク技術、通信速度の高速化などにより翻訳精度が飛躍的に改善した。
瞬時に翻訳
その結果、英語、中国語、フランス語、スペイン語など31言語の文字翻訳に対応し、そのうち23言語で音声入力、17言語で音声出力が可能になり、このアプリはスマートフォンなどにダウンロードして使うが、個人利用は無料。すでにこのアプリは200万回もダウンロードされている。現在はこの機能を生かして、実用化に向けてパナソニック、富士通などのメーカーが製品化しようとしている。
4日のデモでは、空港でスーツケースをなくしたという設定で日本語と中国語でのやりとり、病院で採血、血圧を測定するというシーンでの日本語と英語での会話を「ボイストラ」を使って翻訳した。1秒もかからずに瞬時に相手の国の言葉に訳され、会話が途切れることもなくスムーズな翻訳には驚かされた。ネイティブスピーカーが話しているのと変わらないほど高精度の翻訳が瞬時にできるレベルにまでなっている。
タブレットかスマホの画面には、「入力した文」「翻訳した結果」「逆翻訳結果」の3つの画面が表示される。「翻訳した結果」を見れば、相手と話した言葉が即座に翻訳して表示される。また「逆翻訳結果」を見れば、翻訳された内容が自分の話した内容と合致しているかを確認できる。
今回のデモでは話す人が静かな環境でクリアな声で話したため、間違うことなく同時翻訳された。しかし、雑音が多かったり、「あー、うー」とか前置きが長かったりすると翻訳できないなど改善点が残されており、今後はさらにデータを集積することで、こうした点を修正していきたいとしている。
翻訳バンク
NICTは総務省とともに、さまざまな分野の翻訳データをオールジャパン体制で集積し、自動翻訳の多分野化・高精度化に活用しようとしている。具体的には、医療、ファイナンス、法律、知的財産、IRなど、それぞれの分野に合わせたアプリを作ることにより、その分野での翻訳精度をアップしたい狙いがある。
隅田氏は「原文と翻訳文のデータ量を増やせば、翻訳性能が上がるというのは経験的に分かっているので、どうやってデータを集めるかが重要になる。法律や医療などの分野はまだデータが不足している。今後はそれぞれの分野のデータを蓄積して性能を高めたい」と指摘、そのために大量の翻訳データを集積した「翻訳バンク」の必要性を強調している。
「翻訳バンク」の具体例としては、特許庁とは連携して、対訳データを集めており、特許庁の審査官は、毎日このシステムを使って特許の審査をしている。いまでは、人間が行う翻訳の下訳として十分使えるほど高性能になっているという。