第6回ChatGPTニュース配信| | 「薬剤師パパの奮闘記|隙間時間と家族と副業と、時々くすり」

「薬剤師パパの奮闘記|隙間時間と家族と副業と、時々くすり」

パパ薬です。 『隙間時間で夢を叶える!薬剤師パパの副業奮闘記。家族との時間も仕事も副業も諦めない。』をキャッチコピーに、このブログでは、薬剤師として働く傍ら、家族との時間を大切にしながら副業に奮闘する日常を発信しています。

 

1. はじめに:今回のゴール

 

皆さん、こんにちは、パパ薬です。
第6回となる今回は、「医療DXニュースなどテーマごとに最新ニュースを毎週10件、自動収集する」というミッションに再チャレンジ。

前回の改善がどこまで効いたかをチェックし、次の打ち手を探ります。

 


2. 前回の振り返り:やったこと

  1. タスク分割で件数保証を徹底
    テーマごとに別タスクを作成し、全体の該当なし判定を回避
    月曜は医療DX、火曜はマイナンバー・・・など曜日ごとにテーマを分割
  2. ドメイン指定による参照元の厳格化
    参照元はドメインベースで明記し、擬似リンク生成を抑制

 

前回プロンプト
毎週月曜午前6時に、
先週1週間で報じられた医療DX関連の主要ニュースを
最新順で10件取得してください。
- 出力形式:1.タイトル(〜30字):要約(200字以内) [出典](クリック可能URL)
- 各URLは後工程でステータスコード200を確認
- 件数不足時は、見つかった件数だけを出力
- 該当ニュースがなければ「該当ニュースなし」と出力
- 参照元は下記のドメインを参照 
・厚生労働省:https://www.mhlw.go.jp 
・中医協:https://www.mhlw.go.jp/stf/shingi/shingi-chuo_128154.html 
・m3.com :https://top.m3.com/ 
・日経メディカルOnline:https://medical.nikkeibp.co.jp/ 
・日経DI :https://medical.nikkeibp.co.jp/inc/all/di/ 
・ミクスOnline:https://www.mixonline.jp/ 
・Answer News:https://answers.ten-navi.com/pharmanews/ 
・薬剤師の脳みそ:https://yakuzaishi.love/ 
・KusuriPro:https://kusuripro.com/


これにより、理想は「1タスクで10件+正しいURL」が返るはずでした。


3. 実行結果:どうだった?

  • 取得件数は1件のみ

     
  • 参照元はまたもm3.com猪瀬さんの記事
    image
     
  • 過去3回とも同じURLを繰り返し返す現象

…残念ながら、まだまだ狙い通りには届きませんでした。


4. 原因分析:なぜこうなった?

主要課題

  • Tasks機能はWebクロール非対応 → モデル内部知識から“覚えている記事”を返すだけ
    ChatGPTのタスク機能は、あくまで生成モデルとしての学習済み知識をもとに文章を生成する仕組みであり、実際にWebをクロールして最新情報を取得する機能を備えていないようです。

    • そのため、「先週報じられたニュースを10件集めてください」と指示しても、バックグラウンドでWeb検索が走るわけではなく、学習済みの知識から“ありそうな記事”を疑似生成するにとどまります
    • 実際のWebサイトを自動で巡回し、新着記事をピックアップするわけではないため、最新の現地サイトを参照できずに古い情報や架空のリンクを返してしまうことが多いようです
       
  • 件数指定のフォールバック設計 → 最初の1件で「件数不足」と判断し出力終了

    「最新10件取得」をプロンプトで指定しても、ChatGPT Tasksは内部的に“該当ニュースが足りない”と判断した場合、出力を途中で止めてしまう傾向があるようです。
    • 具体的には、モデルがニュース候補のなかで「情報が見つからない」と判断した最初の1件目で“件数不足”と処理を打ち切り、残り候補を返さずに終了してしまうことがあります。

    • 結果として、「10件取得」を期待していても、実際には1件だけが出力され、残りは一切返されないケースが多発します

 

  • ドメイン指定は文字情報マッチ → 実際の最新記事は拾えずハルシネーション多発

    プロンプト内で「参照元ドメイン:site:mhlw.go.jp」などと指定しても、ChatGPTは実際にWeb検索を行うのではなく、指定された文字列がモデル内部にあるかを“文字列マッチ”的に参照し、そこから連想されるURLを擬似生成してしまう可能性があるようです。
    • そのため、実在する最新の記事ではなく、モデルが“知っていそうなm3.comの記事”を優先して返すケースがあり、結果的に同じURLが繰り返し出力されることが多い
    • 実際のWebサイトに接続して新しい記事を検知するわけではないため、ドメイン指定が“最新記事の抽出”に直結せず、ハルシネーション(架空記事生成)が増える傾向。

以上の仕組み的制約が重なることで、「本当に最新の10件を自動収集する」という要件を満たせず、質の高い自動配信が阻まれます

 

 

5. 次回プラン:どう改善する?

1. ブラウズプラグイン併用

ChatGPT単体ではWebクローリングができないため、「Browse with Bing(ブラウズプラグイン)」を有効化して実際の検索結果を利用する方法があるみたいです 。

  • プラグインの概要

    • ChatGPT有料プラン(Plus/Pro/Team)では、プラグインストアから「Browse with Bing」を導入でき、実際にインターネット検索を行って最新情報を取得できます 。

2. タスクの細分化

「医療DX」をさらに細かいサブテーマ(電子処方箋/電子カルテ/AI薬歴支援・・・)に分割し、それぞれ少数件ずつ取得する方法も有効そうです。

 

以上の改善点を加味したプロンプトを下記に示します。

 

改善プロンプト
毎週月曜午前6時に、ブラウズ with Bing プラグインを使って先週1週間で報じられた医療DX関連の主要ニュースを検索し、最新順で10件取得してください。
以下サブテーマ別に取得してください。
- A. 電子処方箋:最新3件
- B. 電子カルテ:最新1件
- C. AI薬歴支援:最新1件
- D. 医療情報連携・インターオペラリティ:最新2件
- E. その他:3件
- 検索クエリ例:"医療 DX site:mhlw.go.jp" OR "医療 DX site:medical.nikkeibp.co.jp" OR "医療 DX site:medical.nikkeibp.co.jp/inc/all/di/" OR "医療 DX site:mixonline.jp/" OR "医療 DX site:answers.ten-navi.com/pharmanews/" OR "医療 DX site:yakuzaishi.love/" OR "医療 DX site:kusuripro.com/" など
- 出力形式:1. タイトル(30字以内):要約(200字以内) [出典](URL)
- 各URLはプラグインで実際にアクセス可能なもののみ含む
- 件数不足時は見つかった件数だけ出力し、残りは「該当ニュースなし」と回答
- 重要度を★1~★3でランク付け


6. まとめ

今回も1件のみの取得にとどまりましたが、原因は「Tasks機能の検索非対応」「件数設計のフォールバック」。

次回はプラグイン併用+タスク細分化で10件確実収集にトライします。

自動配信の完成形に向けて、一緒に試行錯誤していきましょう!

 

✏️ 次回予告:

「Bingブラウズ×サブテーマ分割で10件取れるか?」をレポートします。お楽しみに!