第5回AKB48総選挙  - の前に、これまでの票の分布を分析してみる | プロムナード

プロムナード

古いこと、新しいこと
いつでも、どこでも
思いつくまま、気の向くまま

明日の第5回AKB48総選挙の前に、これまでの票の「ばらけ方」について調べてみた。

2011年については1-40位までのデータしかないので、2012年についても同様に1-40位で比較する。


この「ばらけ方」を見るためには、票数について単純に平均の値を取るのではなく、二乗平均平方根というアルゴリズムで票の分布をみる方法が効果的である。この方法を使うと、票が特定のメンバーに集中しているかどうかが分かる。

つまり、票の分布状態がわかるのだ。

例えば、5人の平均を取るとした場合、全員の得票数がそれぞれ10票だったとすると平均の値は10票となる。しかし例えば1位が20票、2位が15票、3位が10票、4位が5票、5位が0票であった場合でも、単純な平均(相加平均という)を取れば同じ10票と計算されるので、その数字で見る限りは前者でも後者でも値に差はない。しかし、票の分布としては大きな違いがあるのだ。

この差異を表示させるためによく用いられる計算方法が二乗平均平方根という計算方法で、これを使うと「ばらけ方」が表現できる。

この方法で計算すると、先の例では、12.24票となる。この値が相加平均とどれだけ離れているかで、ばらけ方が判る。例えば、極端な例として一人で50票を獲得し、残りは0票であった場合を考えると、単純平均は10票となるが、二乗平均平方根では22.36票となる。先の例の12.24と比べると単純平均との乖離が大きい、つまり票が特定の人にのみ集中しているといことが理解できるわけだ。

具体的な二乗平均平方根の計算方法については、以前のブログに書いたが、要はそれぞれの値を二乗して足して平均値を出し、その値の平方根を取るというやり方だ。二乗平均平方根の数字が単純平均の値に近いほど票のばらつきが分布しているということになる。

http://ameblo.jp/millimeter-wave/entry-11484089694.html

さて、この方法を使って計算してみると、2011年と2012年では少し様相が異なる。

2011年:
1-40位   相加平均         27,033
1-40位   二乗平均平方根  40,636  
相加平均との開き       1.50

2012年:
1-40位   相加平均         28,025
1-40位   二乗平均平方根  36,823  
相加平均との開き       1.31

これを見ると、2012年は2011年と比べて票数が増え、票が広く分布していたことが分かる。つまり2011年のときは票が特定のメンバーに集中していたということだ。実際、1位票数は3位のおよそ2倍ぐらいの票を得ている。これを2012年で見ると、1位と3位の差が縮まったことからも票が分布していることもわかる。

さて、今年はどうなるか。このブログでも何回か取り上げたが、この一年間でAKB48という仕様に合う若年層も多く出現してきた。総選挙での票獲得数は必ずしも人気と合致するものではないために、頑張っているという姿に対する応援手段として、人気とは別の次元で投票されることも多々あるので、更に票割れが進むことも大いに考えられる。

どうなるか、明日それが判明する。