アルツハイマー病(AD)は、進行性の神経変性疾患であり、世界中で何百万人もの人々が罹患しています。ADの早期発見は、効果的な治療と管理にとって極めて重要です。しかし、現在の診断方法は、高価であり、時間がかかることが多い。近年、ADに関連する認知機能低下を検出するための費用対効果の高いツールとして、音声データの活用に関心が高まっています。







本ブログでは、「自発的な発話による多言語アルツハイマー型認知症の認識」と題された最近の研究論文を紹介します:著者らは、音声データを用いてAD患者の認知機能低下を検出するための、言語にとらわれないアプローチを提案しています。









著者らは、健常者とAD患者の両方から、英語とギリシャ語の音声サンプルを収集しました。そして、音声データから音響特性と言語特性を抽出し、分類と回帰タスクのための機械学習モデルを訓練した。







分類モデルは、発話データに基づいて健常者とAD患者を区別することを目的としています。著者らは、わずか24個の特徴を用いて2つのグループを区別することで、69%の精度を達成しました。これは、数千個の特徴を用いた従来のモデルよりも大幅に少ない数です。







回帰モデルは、発話データに基づいて認知テストのスコアを予測することを目的としています。同じ特徴量を用いて認知テストのスコアを予測したところ、RMSEは4.8となった。





この研究の興味深い点の1つは、言語にとらわれないアプローチである。著者らは英語の音声サンプルでモデルを訓練したが、追加の訓練や修正なしに、ギリシャ語の音声サンプルにうまく適用することができた。このことは、提案されたアプローチが異なる言語や文化圏で適用可能であることを示唆している。




本研究のもう一つの重要な側面は、説明可能性に焦点を当てたことである。著者らは、ADの診断に関連すると考えられる少数の特徴のみを使用し、何千もの特徴を使用した従来のモデルよりも解釈しやすくしています。このことは、特に臨床現場において、モデルやその予測に対する信頼性を高めるために重要である。





全体として、本研究は、ADに伴う認知機能低下を検出するための費用対効果の高いツールとして、音声データを使用する可能性を示しています。言語にとらわれないアプローチと説明可能性に焦点を当てたことで、この分野における今後の研究の有望な道筋となる。