明朝9時に日本橋に集合ね。

日本語って難しいよな。

AIが言語を流暢に文字にすることは出来るのは、昨今のAIとチャットしてみれば解る。

しかし、いざ音声出力をさせようとすると、こういったインシデントが発生することは明白なんだよね。

つまり、読み手がその漢字をどう読むのかを、文脈から判断するしかないのは、AI側も同じなのだが、それが難しいことが解るだろう。

ざっくりとだが、AIの仕組みは解っているほうだと思うのだが、こういった違いをLLMの内部に持ち合わせているのかどうかまでは、知らないというか、開発者側が決定することなのだとは思っている。

つまり、東京の日本橋であれば、「にほんばし」と読み、大阪の日本橋であれば、「にっぽんばし」と読み、福島の日本橋であれば、「ひもとばし」と読みわける必要があることになる。

こういったことは、別に日本橋に限った話しではないことは、日本に住む日本人であれば、理解してはいるだろう。

地名、駅名、人名、などなど、いくらでも例が出てくることだろう。

何が言いたいかというと、AIのLLMは、これらを別のものとしてそれぞれ別のベクトル座標を持っていて、東京、大阪、福島というものと近いものがそれぞれ存在している必要があるってことなんだろう。

こういった例は、別に日本語の漢字、ひらがな、カタカナという文字文化だから起こるってわけではないようで、英語でも同じ単語で別の意味を持つことは普通に存在している。

つまり、短文でそれを正しく理解するのは文語でも口語でも同じで、それを決定づけるのにもうすこし情報が必要になってしまうってことなんだろう。

地名、駅名などで、混乱したものなどございましたら、コメントにてお待ちしております。

ではでは