「偏差値」と聞くと、あまりいい思い出がない人が多いかもしれませんね。
ですが、アフィリエイトを行う上で、実は知っておいた方がいい「統計学」の知識があります。
■よくある分布
人口の分布、自動車事故にあう確率、不良品が発生する割合、試験の成績など、様々なデータを集めたとき、それらの特徴はたいていある形にまとまります。
よく出てくるのが、この図のようなものです。
ウィキペディア「正規分布」より
横軸が「発生する値」で、縦軸が「その値が発生する回数」です。
例えば、試験の成績の場合、横軸は点数で0~100点となり、縦軸はその点数を取った生徒の数になるでしょう。
この図は、赤や青の色で分けられていますが、例えば赤色が国語、青色が数学、ピンクが社会などとなります。
これらは、平均値(最も背が高い部分)を中心にして、左右きれいな山形「釣鐘(つりがね)型」をしていますね。
統計学では「正規分布」と呼ばれますが、試験の成績や、物を作ったときの誤差などは、たいていこの形になります。
この図では、赤色はとがっているのに対して、青色はずっとなだらかですが、この形の違い具合は、平均値からの隔たり「偏差」と呼ばれて、「偏差値」を計算する元になるものです。
■インターネットではこちらの分布?
そしてもうひとつ知っておきたいのが、こちらの「ベキ分布」です。
ウィキペディア「冪乗則」より
先ほどの「正規分布」とはずいぶん違います。
この分布は、“上限がないかそれに近い場合”に現われるものです。
アクセスされるキーワードを並べた場合、特定の少数のキーワードは数が非常に多く、それ以外のものは極端に少ないことに気づくでしょう。
そういった場合の分布の様子です。
またこのブログの右側にはi2iのアクセスランキングを設置していますが、これも検索エンジンからのアクセスが多数で、その他はごくわずかであることがわかります。
他には、例えばプロゴルファーとその獲得賞金額の関係です。
つまり、ごくわずかのトッププロが賞金のほとんどを獲得しているのに対して、それ以下のプロはごくわずかの金額を皆で分け合っている、という状況です。
「ロングテール」という言葉がありますが、それは、このわずかな“尻尾”の部分を指しているんですね。
インターネットにおいては、“上限がないせいか”こちらの分布に従う場合が多いようです。
よく「95%のアフィリエイターは月に5000円も稼げていない」とまことしやかにささやかれてはいますが、もしこの分布に従うとするならば、それも当たっているのかもしれません。

