統計解析は、ある母集団を定義してその母集団に関するある結論を導き出すための手法ですので、母集団がどう定義されているかというのは、きわめて重要な論点です。
母集団は、一般的に非常に大量のデータの集合、場合によってはすべてを観測するのが不可能なほどのデータの集まりですので、そこから標本(サンプル)を抽出し、標本調査をして全体としての母集団を推測するわけで、この手法を推測統計と呼んでいます。
この場合、標本から得られる結論が適用できるのは、本来、事前に定義してある母集団についてのみであることが原則ですが、拡大解釈をしているケースが沢山あります。
「貯蓄残高、増加の傾向」
「高校生の70%が性体験済み」
「国民の90%が憲法改正に反対」
「顧客満足度平均4.8(5段階ポイント)」
とかいろんな記事の見出しがありますが、よくみなければならないのが
「誰を対象に調査したか」「何人に調査したか」というポイントです。
これらが表記されていない結果は、統計を知らないか、意図的に隠しているかのどちらかです。
例えば、上記の「高校生の70%が性体験済み」などといわれると、時代は変わったなあ、なんていう溜息が漏れそうですが、よくよく見ると、渋谷のセンター街で10人に聞いてみた、なんていうオチがあったりします。こんな結果を、高校生に一般化させても決して信頼できる数値じゃないのは明らかです。
リサーチ結果を見るときは、母集団がどう定義されていて、どのようにして何人に調査したか、という視点を忘れないようする、というのは鉄則としたいものです。