読み書き能力
言葉の定義
統計・推定?
新聞記事・テレビ・週刊誌・書籍・ネットのblog・研究報告・論文などに書かれていることの信憑性とは???
●「一次情報」か? 「二次情報」か? 「三次情報」か?
二次情報以降では情報の歪みは避けられない。
●「意見」なのか? それとも「意見に対する感想」なのか? 「希望・願望」なのか?
●「全体のデータ」なのか? それとも「サンプルデータ」なのか?
●「言葉の定義は?」
●「過去から未来をどの程度予測できるのか? できないのか?」
「感想」「意見」はある個人 or 団体etcが言っていること。
「サンプル(標本)調査のデータ」とは、調査した対象の言ってること。
「全体(母集団)のデータ」が求めるもの。
(例)
自動車の故障について、
■「ベンツは故障しやすいと思う」「ベンツは壊れやすい」→「感想」「意見」
■「ベンツ100台について調査したところ発売後3年の故障率が20%だった」→「サンプル調査(標本調査)」
■「発売されたベンツ全てを調査したところ、発売後3年の故障率は18.2%だった」→「全体のデータ(母集団のデータ)」
■「故障」の定義とは何か? 明示されているのか?
一般に、全数調査をするのは費用・手間などから不可能な場合も多く、その場合には「サンプル調査を行い、全体を推定する」ことを行う。
全体の推定は、確率的なものとなる。
サンプルの数は十分に多いか?
サンプルの選び方に問題はないのか?
サンプルデータの「平均値」は? 「中央値」は?
データの分布が正規分布(左右対称、釣鐘状)をとるときは、平均値に意味がある。
正規分布をとらない場合は、平均値よりも中央値(例えばサンプルデータ数が7個の場合なら4番目のデータ)の方が意味がある。
正規分布のグラフ wikipedia
「誤差」はどのくらいか_?
(正規分布をとるデータの場合)「平均」だけでなく「標準偏差(ばらつき)」は?
2つのものを比較する場合、例えばAグループの平均がBグループの平均より大きい場合に、「AがBより大きい」と言えるのは、何%くらいの確率であるか? 何%くらいの誤差(間違い)があるのか?
有意差の検定はなされているのか?
「確からしさ」はどの程度か?