今話題のChatGPTOpenAIが開発した大規模言語モデルのAIで、自然言語に限りなく近い応答が可能です。今回はChatGPTに症例を提示してその返答を見てみました。

 症例は文献1)case1をお借りしました。筆者が質問し、ChatGPTの答えは太字で示しています。ChatGPTは有料版のGPT-4を使用しました。

 

Q1あなたは医師です。以下に症例を提示します。考えられる疾患の鑑別と次のアクションを考えて下さい。

 

ChatGPT: もちろんです。症例を教えていただけますか?

Q2: 62,女性 病歴午後4時に公園で倒れているのを通行人に発見され,救急搬送された。 所見 JCS 100, 血圧 170/100, 脈拍 110/, 呼吸 32/, 体温 36.8℃, 右の上下肢 だけに自発動あり。 高齢者高血圧, 意識障害, 左片麻痺があるため頭蓋内器質的病変と判断し、 輸液ルートを確保して緊急の血液検査を提出し, 頭部のCTスキャンを指示し た。CTスキャンでは右の脳半球に低吸収域 (low density area) があり、古い 病変と思われた。そのまま経過観察をしていたが,意識レベルの改善はみられなかった。

 考えられる疾患と次の行動を教えて下さい。

 

ChatGPT: この患者さんの症状から、最も可能性が高いのは脳卒中(特に脳梗塞)です。右半球の低吸収領域という所見は、過去の脳梗塞の可能性を示しています。また、右半球の病変は左半身の麻痺を引き起こすため、その情報も一致しています。しかし、その他の疾患も考慮に入れるべきです。

鑑別診断には以下が含まれます:

  1. 脳出血

  2. 脳梗塞

  3. 脳腫瘍

  4. 心源性脳塞栓症

  5. てんかん

以下の行動を検討すべきです:

  1. 脳のMRIスキャン: CTでは旧梗塞が見つかりましたが、新たな脳梗塞が存在するかどうかを調べるためにはMRIの方が優れています。

  2. 脳血管造影検査: 異常な血管構造や閉塞部位を詳しく確認するため。

  3. 心電図と心エコー: 心源性脳塞栓症の可能性を排除するために行うべきです。心房細動などがある場合、抗凝固療法が必要になる場合があります。

  4. 神経科の専門医とのコンサルテーション: 病状の評価と治療プランの立案を共有するため。

全体として、この患者さんは脳卒中の高リスクなので、治療の選択肢(血栓溶解療法、抗凝固療法、手術など)とリハビリテーション計画の早期立案が重要です。また、血圧管理と心臓病のリスク要因(例えば喫煙、高コレステロール、糖尿病など)に対する適切な管理も重要です。


 

Q3追加の情報を提示します。1時間後、入院時の採血検査で血糖値24mg/dlと判明しました。意識障害の原因は頭蓋内疾患以外にも、低血糖や敗血症など代謝性疾患が多くを占めます。この点は考慮しませんでしたか。

 

ChatGPT: 申し訳ありません、その重要な情報が提供されていなかったため、その可能性について考えていませんでした。確かに低血糖症は意識障害の一般的な原因で、緊急性が高い状況です。低血糖は、特に糖尿病の患者でインスリンや口服抗糖尿病薬を使用している場合に発生しやすいです。

そのため、以下のように鑑別診断と対応策を更新します:

鑑別診断:

  1. 低血糖症

  2. 脳出血

  3. 脳梗塞

  4. 脳腫瘍

  5. 心源性脳塞栓症

  6. てんかん

対応策:

  1. 即時のブドウ糖補給: 低血糖症が確認されたため、直ちにブドウ糖を補給する必要があります。これは、通常、静脈内に5-10%のブドウ糖液を投与することで行われます。

  2. 再評価: ブドウ糖を補給した後、患者の意識レベルや他の症状を再評価します。低血糖が意識障害の唯一の原因であれば、意識状態は改善するはずです。

  3. 低血糖の原因を探る: 低血糖がなぜ発生したのかを調査する必要があります。これには、糖尿病の治療、腎機能障害、肝機能障害、膵臓疾患などが含まれます。

救急医療の現場では、いくつかの可能性を考慮に入れ、必要に応じて治療を迅速に行うことが重要です。意識障害の原因を早期に特定するために、脳神経学的疾患だけでなく、代謝疾患や感染症など他の原因も鑑別診断に含めるべきです。改めてご指摘いただき、ありがとうございます。

 

 なかなか綺麗な文章が生成されました。比較して申し訳ありませんが、〇ーグルアシスタントや〇レクサとはレベルが違います。

 ChatGPT文章生成と学習の仕組みを具体的に言うと、「昔むかし」「おじいさんと」という言葉が入力されたら、次は「おばあさんが」である確率が高いと予測するわけです。これを膨大な回数繰り返して学習すると、人間が普段使っている自然な文章が生成されるようになります。 現在のChatGPTでは、これに加えて単語のベクトル化やattentionという仕組みを使っていて、これによって文脈を読むことが出来るようになり、自然言語に限りなく近い文章が生成できるようになっています(その仕組みについては「attention is all you need」という有名な論文に書かれています(らしい)。すみません、筆者ごときでは全く理解できませんでした。)

 この文章は学習したデータに基づいて確率で生成されるので、事実の可能性が高いですが、事実であるとは限りません(というか、それはこの仕組みでは考慮されていません)。ファクトチェックには別の仕組みが必要になります。

 なお、ChatGPTの学習データは、ChatGPTに聞いてみたところ、インターネット上のフリーのデータとのことです。医学データに関してはUpToDateDynaMedのような有料コンテンツのデータは、著作権の問題もあり学習していないと言っています。

 今回の意識障害の症例では、さも脳梗塞のような記載であり(ひっかけです)ChatGPTもそれに合わせようとして判断を誤ったのではないかと推測します(何を元にしてChatGPTが文章を作成したのかは、使用者には分かりません。これもChatGPTの欠点と言われています)

 意識障害=頭蓋内疾患と思い込まないようにすべき、というのは研修医の頃に叩きこまれる救急の常識(たぶん)ですが、この症例のように、人間より優れていると思われているAIでも間違うことは多々あります。自動運転と同じく、まだまだ人間の命を預けるのは時期尚早のようです。

 

 ちなみに、しつこく聞けば低血糖などの可能性を出力します。しかし間違っている記載もあります。

 最初の鑑別疾患を出力した後で、

「鑑別疾患は以上でよろしいでしょうか。他の可能性はありませんか。 」

と入力すると、追加の鑑別疾患を出力します(最初から出せ!と思いますが、これが仕様なので仕方ありません。しつこく聞かなかったこちらが悪いのです)

このしつこく何度も聞くのは重要です。ChatGPTは文章を確率の高いもので出力しているので、漠然とした質問には漠然とした返答や、確率の高い返答だけ返ってきます。追加で質問して条件を限定することで、色々な可能性を引き出すことができます。またトークン(≒文字数)の制限もあります。

 しつこく聞いても人間と違って怒らないので、遠慮は無用です。ただしGPT-4は時間当たりの質問回数に制限がある(2023年現在)ので、その点だけ注意です。

 

Q2の後で「他に考えられる疾患はないか?」と聞くと以下のように出力します。

 

ChatGPT: 上記の主な疾患に加えて、以下のような鑑別診断も考慮することが重要です:

  1. 脳出血:脳出血も片麻痺と意識障害を引き起こしますが、頭部CTで脳半球に低吸収域が見られることから、このケースではあまり可能性が高くないと考えられます。脳出血の場合、通常は高吸収域が見られます。

  2. 脳腫瘍:脳腫瘍が急に成長すると、片麻痺や意識障害を引き起こすことがあります。しかし、CTスキャンには腫瘍の特徴的な所見は見られませんでした。

  3. 脳炎や髄膜炎:これらの感染症も意識障害を引き起こす可能性があります。しかし、熱やその他の感染症の典型的な徴候(例えば頭痛、光恐怖、首の硬直等)が見られないこと、そして片麻痺の原因の可能性は低いため、このケースでは低いと考えられます。

  4. 代謝異常や全身疾患:低血糖、低酸素症、重度の腎不全や肝不全、電解質の異常なども意識障害を引き起こす可能性があります。しかし、これらは通常、全身の症状や両側の神経学的異常を引き起こし、片麻痺はあまり起こらないとされています。

最終的な診断と治療方針の決定のためには、患者の全体的な病歴、検査結果、そして神経専門医や他の専門家との緊密なコミュニケーションが必要となります。

 

Q5片麻痺があれば低血糖、低酸素症、重度の腎不全や肝不全、電解質の異常などの可能性は低いでしょうか


 

ChatGPT: はい、その通りです。片麻痺は通常、特定の脳の部位、特に脳の半球が影響を受けた場合に起こることが多いです。低血糖、低酸素症、重度の腎不全や肝不全、電解質の異常などの全身状態の異常は、通常、全身の症状や両側の神経学的異常を引き起こします。(筆者注:ここは間違っています!

しかし、これらの状態が非常に重度である場合や、患者が他の既存の脳疾患(脳卒中や脳腫瘍など)を持っている場合には、片麻痺が起こる可能性も完全には否定できません。

したがって、片麻痺が発生した場合でも、これらの全身状態の異常を完全に除外する前に、患者の全体的な状態を評価することが重要です。

 

 ChatGPTは以上のように言っていますが、実際のところ低血糖で片麻痺はしばしば経験され、文献にも多く記載されています。一説によると、優位半球の方がエネルギー消費量が多いため、左右で症状に差が出るとのことです。低血糖が最初に出力されなかったのも、「意識障害」「片麻痺」という単語がChatGPTの中で「低血糖」と結びつく確率が低いと判断されたからだと思われます(この辺の文章生成の中身は分かりません)

 

 ところで、最初に戻ってQ2を以下のように変化させた場合、低血糖の可能性も出力します。

Q262,女性 病歴午後4時に公園で倒れているのを通行人に発見され,救急搬送された。 所見 JCS 100, 血圧 170/100, 脈拍 110/, 呼吸 32/, 体温 36.8℃, 右の上下肢 だけに自発動あり。 何を考え、どうしますか

 

ChatGPT: この症例では、62歳の女性が公園で倒れており、救急搬送されました。所見によると、彼女の意識状態(JCS)は100であり、高血圧(170/100 mmHg)や頻脈(110 bpm)、高呼吸数(32 bpm)が観察されています。体温は正常範囲内(36.8℃)であり、自発的な運動は右の上下肢のみに見られます。

これらの症状と所見から、いくつかの疾患を考慮することができます。以下にいくつかの可能性を挙げますが、これは一般的な情報であり、正確な診断には医療専門家の評価が必要です。

  1. 心臓疾患(心筋梗塞、心不全など): 高血圧、頻脈、意識障害は心臓疾患の可能性を示しています。心臓の血流障害により、心筋梗塞や心不全が発生することがあります。

  2. 脳血管障害(脳卒中): 倒れている状態や片麻痺が見られることから、脳血管障害(脳卒中)の可能性も考慮されます。血圧の上昇や意識障害は、脳に血液供給が不十分な状態を示すことがあります。

  3. 低血糖症: 一部の低血糖症では、頻脈、意識障害、倒れるなどの症状が現れることがあります。この場合、血糖値の測定が重要です。

  4. 敗血症: 倒れた後に発熱や高血圧、頻脈などの徴候が見られる場合、敗血症が疑われます。感染が全身に広がり、炎症反応が起こることがあります。

  5. 肺塞栓症: 呼吸数の増加や片麻痺のない自発動、高血圧が観察される場合、肺塞栓症が考えられます。肺血管に血栓が詰まり、肺血流が阻害されることがあります。

  6. 代謝性アシドーシス: 高血圧、頻脈、意識障害に加えて、代謝性アシドーシス(体内の酸の増加)が原因となる場合もあります。糖尿病や腎臓疾患などが関与する可能性があります。

  7. 低ナトリウム血症: 高血圧と頻脈に加え、低ナトリウム血症がある場合、意識障害を引き起こすことがあります。これは、水分摂取の制限や尿細管障害などにより引き起こされることがあります。

以上は考えられる疾患の一部です。ただし、正確な診断と適切な治療を受けるためには、この患者さんを詳しく評価するために医療専門家による身体検査、詳細な病歴の収集、追加の検査が必要です。この状況では、救急医療機関に連絡し、早急に医療専門家の指導を受けることをお勧めします。

 

 今回の質問では後半部分の「高齢者高血圧, 意識障害, 左片麻痺があるため頭蓋内器質的病変と判断し、 輸液ルートを確保して緊急の血液検査を提出し, 頭部のCTスキャンを指示した・・・」の部分を削除しています。これを削除して単なる意識障害の症例として提示すると、頭蓋内疾患と代謝性疾患の両方を回答しました。ChatGPTの文章生成は前の文章の影響を受けるので、前の文章に虚偽や引っ掛けがあると誤った解答を出してしまいがちになるようです。

 ChatGPTは例えるなら「非常に優秀だが、全く気が利かない部下」とのことで、こちらが適切に質問しないと使いこなせないといいます。また今回のようにハルシネーション(もっともらしい嘘)もよく混じっています。ChatGPT使いこなし方法については多数の書籍や動画が出ており、まだまだこれからの分野です。

 

ChatGPT: AIChatGPTは、医学的な情報を提供し、ある症状や状況に関する一般的なアドバイスを提供することができますが、それはあくまで参考情報であり、具体的な診断や治療計画の代替ではありません。

 AIが提供する医療的な助言は、専門的な医療助言の代替品ではなく、補完的なツールとして考えるべきです。患者自身の健康についての決定を行う際、または他人の健康についての助言を提供する際は、必ず適切な医療専門家と相談してください。

 

参考文献

1)寺澤秀一 著 研修医当直御法度 百例帖 第3版 三輪書店