言語の複雑性をエントロピー圧縮で測ってみたらどの言語が難しいかわかるだろうか? (4) | Chandler@Berlin

Chandler@Berlin

ベルリン在住

言語による本の厚さの違い

私の同僚であった,また先生でもある Joerg は私に,日本語の本は漢字を使っており,文字の種類が多数あるために本の厚さが薄くなるのかという疑問を投げかけた.つまり,一文字の示す情報が英語の Alphabet に比べて大きいためにある種の圧縮がかかっているのと同じではないのかという疑問である.たしかに「山」という文字は英語では,「mountain」と8文字になる. ただし,一文字の大きさは本によって違うなどいろいろと考慮する点はある.

私は Shakespeare の本が日本の翻訳されたものの方が薄いということを答えた.Shakespeare であれば,その翻訳は原文にできるだけ忠実であると予想されるから比較対象として良いのではないかと思ったのだ.しかし,日本の本が薄いのは紙の質によるかもしれないし,単純に文字の大きさの問題であるかもしれない.単純に本の厚さというのでは考慮すべきパラメータが多すぎる.