日本語には「3つの特徴」がある
AIに日本語を教えるにあたり、まずは日本語の文法を作り直す必要があります。そうする必要がある最初の理由は、日本語には単語の区切りがあるようでないこと。アルファベットの世界では単語と単語の間に半角スペースを入れるので、明確に単語と単語の間に区切りがあります。しかし日本語にはそれがありません。これでは言葉の生成などままならないのも当然です。
「あと一歩のところで戦争でした」――この文章の単語の切れ目がどこにあるのか明確には分かりません。主語と述語の関係も分かりません。日本語の文章はSVOCにはなっていないのです。「昨日は僕はオフでした」この文章の主語は何でしょう。昨日でしょうか、僕でしょうか。主語が2つあるようにも思えます。
もともと曖昧だった日本語は、戦後、GHQの政策によって無理矢理、表記を統一して教育の標準化をおこないました。これによって生まれた文法を使っても、日本語プログラマーはうまく日本語を扱うことができない、という仮説を私は立てています。
例えば「昨日、おまえ、デート、したの、昌子と?」という問いに対して、
・「昨日」にアクセントがあれば、「昨日じゃないよ先週だよ」と答えます。
・「おまえ」にアクセントがあれば、「俺じゃないよ田中だよ」と答えます。
・「デート」にアクセントがあれば、「あれはデートじゃないよ」と答えます。
・「したの」にアクセントがあれば、「してないよ」と答えます。
・「昌子」にアクセントがあれば、「昌子じゃないよ、淳子だよ」と答えます。
つまりメロディを変化させるだけで質問の意味が変わってきます。シーマンはメロディを理解できないので、おまえと言われて疑問形かどうか判断できません。文法が重要視しているのはメロディ認識ではないかと考えています。
メロディとは別に、語尾に「よ」とか「ね」を吟味して付けるという特徴が日本語会話にはあります。これを使わないと会話に違和感がでてくるためです。例えば「三木さんのお子さんは10歳ですよね」ここから「よね」を外すと違和感があります。言い切りの形では、「本人よりも詳しい」というニュアンスになるからです。言っている内容についてどちらがよく知っているか、それが語尾によって決定づけられているわけです。
会話の中の「主見」に注目する
ここまで、日本語に対する問題点を3つ挙げました。単語の切れ目、メロディ、そして語尾の問題です。例えば、「食べる」という動詞は下一段活用とされていますが、食べないもん、食べたくない、食べてたじゃん、食べたらぶっ殺す、これらをひっくるめて活用形と考えると、食べたらぶっ殺す、は食べるの否定形のレベル5になります。レベル4は、食べるなって言っただろ、レベル3は食べるなよ。このように普段使っている慣用句に動詞を代入して使っています。この活用形の中に意味が込められています。これがメロディ言語です。この3つの組み合わせで、意味が通じるようになります。何を言っているのか、誰の意見なのか、これを「主見」と我々は名付けています。三人称なら、食べたがってましたよね、二人称なら食べたいですよね、合意が得られない場合は、食べるもん、食べたいし、食べたいから、これらは自分の主張が強い場合ですね。
これも仮説ですが、日本語は自分と相手との関係において、どこまでが自分のテリトリーか、を確認する、という言語だと考えています。例えば身内を紹介するときに「青山学院大学学長の三木さんに......」と言うと違和感がありますね。身内に「さん」を付けると違和感を感じます。これを外国人が聞くと「さん」が付いていない方に違和感を感じるそうです。目上の偉い人を呼び捨てにしていると。「さん」を付けるかどうかで、そのグループに話者が帰属しているかどうかが分かります。「さん」なしで「ウチの三木がそう申しておりました」と言えば、彼は三木グループに属していることが分かります。
主語、述語以外の単語を数値化して、意味化するのが私たちの仕事です。また、メロディによる文章の意味を定義するために、カラオケの採点システムを作っている音響メーカーと協力してメロディ認識のエンジンを開発しているところです。これらを解析できれば、日本語の文章の正しい意味を伝えられるようになるはずです。