対話検索型人工知能のBINGCHAT、本日も対話の結果を、掲示していきます。
本日第1の話題は、読み上げアプリの構造です。
読み上げアプリ(文章発音アプリ)は、先日取り上げたOCR(光学文字読み取り)アプリと異なって、マッチングの要素はないですが、それでもぶつ切りの音素を滑らかにかつイントネーションを付けてつなぐという、工夫が必要です。この能力も基本的にルールベースでできているのですが、この分野も最近のAIの深層学習で、精度が上がっています。
本日第2の話題は、素朴に、「なぜ日常会話がちぐはぐにならないか」です。
当たり前に見えるかもしれませんが、たとえ日常会話でも、途切れずまた曲がらずに続いていくには、相応の理由があります。まず人は相手の発言を、言葉だけでなく態度を加味して理解しています。これに加えて、①聞き手の相手を理解しようという好意(文脈をより適切に解釈する情報の追加)、②多くの場合深い理解は不要(理解の多少の齟齬は会話に問題ない)、③共通の常識構造(ほぼ同じ体験によって成長している)が、あります。
↓の続きです。
↓に続きます。