Google 一般公開データに日本国内の新型コロナ COVID-19 感染予測が加わりました。
予測期間も米国内で提供されていた14日間から28日間に拡大されています。
上記のダッシュボードでは、28日間の新規感染予測の合計と平均値のみ掲載されていますが、日毎の感染予測推移は載っていなかったので Google BigQuery で感染予測データを取得して、Google データポータルでグラフ化してみました。
※Google BigQuery から取得しなくても、日本国内感染予測データはCSVファイルでも公開されています。
予測はAIにより感染症情報・過去の陽性者数などの統計値のデータでトレーニングしたモデルを使用しているとのことです。
モデルの詳細は記事の最後をご覧ください。
以下、データの取得とグラフ化について手順を追って説明した後、東京、神奈川、北海道、大阪についての感染予測レポートを載せます。
1. Google BigQuery からのデータ取得
①Google BigQuery (COVID-19 Public Forecasts) にログインします。
日本の28日間県別感染予測の一般公開データのリポジトリは、下記になります。
bigquery-public-data:covid19_public_forecasts.japan_prefecture_28d
又は、
bigquery-public-data.covid19_public_forecasts_asia_ne1.japan_prefecture_28d
②上記のクエリを編集してデータ取得のSQL文を入力します。
※下記部分は横スクロールをかけている(SHIFT+マウスホイールスクロール可能)のでPCブラウザモードでご覧ください。
SELECT prefecture_code, prefecture_name, prefecture_name_kanji, forecast_date, prediction_date, new_confirmed, new_confirmed_ground_truth, cumulative_confirmed, new_confirmed_7day_rolling, new_deaths, new_deaths_ground_truth FROM `bigquery-public-data.covid19_public_forecasts_asia_ne1.japan_prefecture_28d` WHERE prediction_date >= "2020-11-21" AND prediction_date <= "2020-12-18" ORDER BY prefecture_code ASC -- DESC LIMIT 2000
③実行ボタンを押すと下部に結果が表示されます。
④上記「結果の保存」ボタンを押してクエリ結果をCSVで保存します。
※直接BigQueryからデータポータルに渡す方法もあるのですが、今回は一度CSVファイルに保存します。
2. Google データポータルを使用したデータのグラフ表示
①データポータルを開きます。
②「データソース」タブを選択し、左上の「+作成」→「データソース」を選択します。
③「ファイルのアップロード」ボタンを押します。
④BigQueryで保存したCSVファイルをドラッグしてアップロードします。
⑤右上の「接続」ボタンを押します。
⑥データが読み込まれスキーマが表示されます。
ここで、「new_confirmed(新規感染者数)」の型が"テキスト"になっているので、"数値"に変更します。
⑦右上の「レポート作成」ボタンを押して、レポート(表、グラフ)を作成します。
⑧左の表は「ピボットテーブル」、右のグラフは「折れ線グラフ」を選択し、東京(TOKYO)と神奈川(KANAGAWA)でフィルタリングして編集してみました。
⑨出来上がった表やグラフのレポートは、右ボタンでPDFで保存できます。今回は、Web上で共有してみます。
⑩右上の「共有」ボタンを押します。
⑪「アクセスを管理する」タブを選択し、アクセス権を設定します。
⑬下記がコピーしたレポートの共有URLです。
同様に東京、神奈川、北海道、大阪についてもグラフを作成してみました。
感染者予測データの取得とグラフ化についての手順は以上です。
[レポートについての考察]:
2つのレポートの内、後者11/26時点の12/21までの予測では、東京と大阪は新規感染者の増加傾向が続きますが、北海道と神奈川は微増傾向で、グループ間で大分差が出てくるようになっています。
また、いずれも12/19で飽和しているように見えます。
GOTOキャンペーンの一時停止で減少傾向に転じればよいのですが。
[参照資料URL]:
※目的・予測モデルの概要: COVID-19 感染予測 (日本版):ユーザーガイド
※予測モデル、モデルの開発に使用された方法論に関するホワイトペーパー: Interpretable Sequence Learning for COVID-19 Forecasting