※ グラフ、数値とコメント修正(7/23)

参議院選挙が終わった。これについてはまた妄言を吐いてみようと思うが、今回は手遅れながら内閣支持率の推移を統計的に考察してみる。
といっても私は統計の大家ではないのでどこまで的確に考察できるかは定かではない。まあ、生兵法怪我の元の領域を出ないぐらいと思ってちょうど良い、ということにして下さい。

次の図はとある新聞で行った世論調査の結果から内閣支持率を取り出したものである。この調査結果自体にも著作権があると思うので、おおっぴらにはいえないのでここだけの内緒話にしていただきたい。

イメージ 1
さて、この新聞はこの結果について調査方法を明示していない。どこかに書いてあるのかも知れないがちょっと見には分からなかった。なんで気にするかというと、世論調査の結果は新聞社、報道機関によっても結構ばらついていて、それぞれランダム抽出と云っているがそれにしても結果が違いすぎるのでは?という疑問があったからである。
ここで気にしたいのは抽出方法ではなく、標本数、つまり調査数である。もちろん各メディアも調査結果だけを報道していて、多少のコメントは付くもののあくまでも調査数内での結果という扱いしかしていない。だがこの結果を利用する側としては(別に私はどうでもいいが)、この値が全体の意向をどう表しているのかチェックしておく必要があるだろうと云うことである。

単純に想像すると、標本数が多いほど結果の精度は高くなると思うだろう。そしてその通りなのだが、ではこの結果の精度は?というのも知りたくなるし、時系列的な動向を知りたい場合はそれぞれの結果の精度を見ておかないと本当に変化しているのかどうか判断を誤る可能性がある。

ということで、ちょとだけ統計学の本をかじってみました。いや歯形はつけていませんが。

で、本によると限られた標本の結果から全体(この場合は標本数に対して十分大きいとする)を推定する場合、確率でしか語れないと云うことだ。たとえば標本数 2000 として、70% という結果が出たとすると、真値は 95% の確率で 68% ~ 72% の間にある、という具合である。
これは標本数と結果と得たい確からしさ(上記の例では 95%)で区間を推定できると云うことである。
標本数が多ければこの区間は狭まるし、多少ラフな精度でも良い、となるとさらに狭まる。

では、前述のデータをどうみるかだが、青い線が公表された結果の数値である。これに対して私が勝手に推測して(確からしさ不明?)標本数 2000 人として、95% の確度で範囲を推測したのが、黄緑の点線である。

推定幅の計算は以下のようである。

p: 得られた結果
n: 標本数
1.96: 95% の確からしさを要求した場合。99% なら 2.58。

データ区間 = p ± (p x (1 - p) / n )^0.5 x 1.96
例: 標本数 2000 で 70% という結果が得られた場合、70% ± (0.7*0.3/2000)^0.5*1.96
→ 70% ± 2%


つまり、両点線の範囲にある確率は 95% だ、ということだから、まあはっきり言って大きな変動はない、とも云える。内閣支持率は発足当時から年明け以降ずっと 69% ぐらいである、といっても 95% ぐらいの確からしさがあると云うことだ。
さらに検定というのがある。
たとえば 5/13 の結果と 6/11 の結果は違っている、有意差があるといえるかというのを検証するわけだが、これは t 検定というのを用いる。ここでは標本数が 2000 人ときわめて不確かな数値を持ってきたのでこれ以上はやめておくが、標本数が正確に分かればやってみる価値はある。

何が言いたいかというと、メディアが公表しているデータを鵜呑みにして何かの判断に用いようとすると、そのデータの背景を確認しないときわめて危ないということである。標本数を明らかにするだけではなく、誤差のパーセントポイントも付記して欲しいものだ。

実はこの考え方はテレビなどの視聴率も同じである。限られた標本数で全体を推定するのだから当然幅を持っている。おそらく視聴率 20% を取って 18% の他の番組に勝った勝ったと云ったって信用して良いかどうか分からない。

これは製品の品質管理上も意味を持つ。生産数が非常に多い場合に限るが、サンプル試験で何かのパラメータをチェックしていった場合、その結果の統計上の誤差も考慮していなくてはいけない。何か変化があった場合、それが本当かどうかは上述の検定を行ってみないと分からないのだ。

統計的手法は身につけようと思ったらやってみるしかない、ところもあると思うので生兵法でもやってみることをお勧めする。近くに指導者がいればなお効果的である。