ワクチン接種と国民の態度については、それ相応に各種の事前研究が進み、接種計画に反映されたりしています。なので、ある程度は関係者の間では「肌感」があるところなのですが、さっきTwitterを見ていたら「Facebookユーザーの大多数がワクチン接種を拒否」とか「18歳から29歳までの40%以上がワクチン接種に否定的」とかいう明らかなガセネタが出回っていたので(既に削除)、元論文を観に行きました。

 そしたら、元ネタは独立行政法人産業経済研究所(RIETI)が発行したディスカッションペーパーのていをした調査報告書だったわけなんですが、流し読みして悶絶するような個所がいくつかあり、椅子から落ちそうになりました。

https://www.rieti.go.jp/jp/publications/dp/21j026.pdf

 元データが開示されていないので検証のしようもないんですが、まず、18歳から29歳の接種済みと回答した人数が3%ほどいて、いきなりサンプルバイアスがきっついことが分かります。なんだよ、973人に聞いて27人が「接種終わりました!」って18歳から29歳が回答するネットアンケート。嘘つきの集まりじゃねえかよ。




 内閣官房CIO室のダッシュボードでは全国民類型の接種率でしか外部からは見られないわけですが、調査日とされる4月下旬のうち、一回だけでも接種した全国民(全年齢)が0.22%、高齢者が0.61%(21年4月29日現在)であることが分かります。

https://cio.go.jp/c19vaccine_dashboard




 もうこの時点で、ネット調査のサンプルとなっている母集団が調査に適さない設計になっていることが一目瞭然なのですが、そこからさらに、各調査項目に対してクロス集計がされ、評価指標や説明変数が説明されています。ただ、母数がゴミデータなのでいくら説明変数を駆使して推論をかけたところでゴミであることに変わりはありません。

 この内容について、サンプルを検証することはなかったのでしょうか。

 あくまで説明できるのは「接種をしていない人を都道府県単位で見たとき、どういう理由で接種したい、したくないという態度を取ったか」という参考値を提示するぐらいまでです。

 さらに、図1で例示されている内容と、報告中のサマリの内容が逆になっています。



 まだ決めていないが30.1%、接種しないつもりが9.0%と4月末時点で回答しているのを、集計表では見事に逆に掲示しとりますね。



 ワクチン接種計画を自治体が策定するにあたり、ワクチン接種拒否の確率については事前にそれなりに調査しており、高齢者で概ね9%ほど、全年齢で13%ほどという知見は既に得られているので、調査結果だけを見ればそんなもんかなと思わないでもありません。ただ、報告書の根拠となる図表で「接種しない」と「わからない」の数字を取り違えるとか、さすがにあり得ないというか、気づけよと思うわけです。

 社会調査をやる側として「なめんなよ」と思うのは、この調査サンプルの所得や貯蓄額を聞いて、めっちゃみんな金持ち回答しとるところに「この数字はおかしい」と気づかないデータマンは廃業しろと思うわけですよ。大多数が勤労状態である時点でおかしいうえ(65歳以上高齢者の約6割近くは年金生活者)、貯蓄額1,000万が最大派閥になっているベースデータを集計した時点で「変だ」と思わないといけません。



 お前らはルクセンブルクで調査したのか? なので、調査対象16,000人に対し「雑誌をもっとも参考にした人、16人」「Facebookをもっとも参考にした人、15人」「ラジオをもっとも参考にした人、111人」とか、わざわざ信頼区間を出す必要があるのかという根本的なところからデータの詰め方を考え直してほしいと思うわけであります。これだとまるでラジオを聴いている人は限界集落で、皆様のNHKが最高信頼となる金のから揚げ賞になってしまいます。

 種明かしをすると、メディアから居住地、所得属性まで全部横断でクロスするのは16,600サンプルでは本来無理で、もう少し説明変数の候補を絞り、尋ねる内容を厳選すればもっと良い調査サマリーになったと思います。きょうび、メディア接触から本人属性まで全部聞いたうえで、単純にイシューを問うのは調査精度が出ないうえ、追跡調査をしないと本当の影響は分からないでしょう。

 データを再集計したり、月イチか四半期ごとに追跡調査をやって、調査項目を然るべき数まで絞り、ディスカッションペーパーとして再提出されることを願います。