なんか最近こう、クリエイトをしたい気分がなんとなくあるんですよ。
それもハンドメイドな感じでっていうか、こじんまりとこだわって時間をかけて何か作ってみたい。
つっても「これを作りたい!」って情熱があるわけじゃないんですよねぇ。変な話です。
ゲームとかテレビ番組とか映画とか小説とか、何か自分の作品を残したい。
反面体調はよくないっす。どうしよ。
近くの小学校で運動会の練習をやっているようです。
踊りの練習なのかなんなのか、『学園天国』が流れてくる。いいですね。あの曲はなんだか楽しくて好きです。
でも練習なので、イントロの「ヘイーヘイ!」がひとしきり流れてさぁこれからメロ!ってときにパッと止まって「ハイ今のとこ~……」なんて先生の声が聞こえてくる。
もどかしい。
聞きかじり統計の話。
詳しい人からすれば幼稚だろうから恥ずかしいけれど。
「とある野球チームで、新人ながら450打数、なんとか規定打席にも到達し打率.290の好成績を収めたA君。しかし首脳陣は彼の成績をまぐれなのか実力なのか見極めかねています。さて、彼の残した数字を信頼すべきでしょうか?」
この問題への見方は色々考えられるでしょうが、大きいのは単純にサンプルの数の問題。
95%信頼区間(100回サンプリングしたら95回はこの範囲内に当てはまるだろうという範囲)というものがありますが、それからすると機会450程度では.290が.250でも.330でも不思議はないことになるようです。
これは500打数でも600打数でも五十歩百歩の話で、年間の打数なんてサンプル数として単純に考えるなら全然アテにならないことになります。
規定打席とは言っても人為的に設けられたラインなだけであってそれを超えていたら信頼出来るとかそういうわけじゃないってことですね。
サンプル数によるブレをなくすには1万打数ぐらい打って下さいって話になってしまいます。
この辺考えるとある意味「数字なんかアテにならん」ってのは正しいです。重要なのは数字のその性格をちゃんと把握したうえで正しい範囲で的確な活用をすること。
前述の例であれば450打数で打率.290の打者は同じ打数で打率.210の打者よりは大体確実に(打率では)上と言えそうです。(信頼区間の下が.250なのに.240の打者の上とか言えないのは比較対象の打者の信頼区間とぶつかってしまって優劣の逆転がありうるため)
単純な打率としての信頼度はその程度、のようです。
例えば.280の打者と.300の打者では100打数ではヒット2本の差でしかありませんしね。