あっという間に読み終わりました、『マンガでわかる統計学』
さて、5章では「確率」をやりました。
この内容を押さえておかないと最後までひきずってしまいます。
確率密度関数、正規分布(ここであのeが出てきます)、標準正規分布、で、カイ二乗分布
変な公式がいっぱい出てきます。
ここで、くじける人もひょっとしたらいるかもしれませんが、ひるんだら負けです。
女子高生ルイちゃんもついて来てます。負けられませんっ!
確率密度関数は、ヒストグラムを曲線にしたもの。
正規分布は、色んな確率密度関数のうち、左右対称のもので、特に標準偏差が1のものを標準正規分布と読んでいる、と。
カイ二乗分布では、自由度とかいう言葉ででてくるけど、グラフを形作る変数ぐらいに捉えて、確率から逆に横軸の目盛りを出すものの分布表くらいに理解しました。
ここでの基本的な知識は、「グラフの面積=全体に対する割合=起こりうる確率」です。
さてさて、昨日は6章の「2変数の関連を調べよう!」をやりました。
ほんの10分くらいで読み終わってしまいました。
最初の章で、数量データ、カテゴリーデータというデータの種類を勉強しました。
で、ばらつきやら基準化やらをやって、雰囲気を知るテクニックを学びました。
次は、データ間の関連性なんだな、と。
で、ここでも特殊な用語と公式が出てきます。
単相関係数:数量データ同士の関連性
相関比:数量データとカテゴリーデータの関連性
クラメールの連関係数:カテゴリーデータ同士の関連性
上記のような理解で、公式は、まぁ、そうやって求めるんだなってな感じで流しました。
数値を求める手順や結果の考察目安が詳細に書いてあるので、ふむふむと感心しながら、読み進めました。
で、とうとう最後の章、7章の「独立性の検定をマスターしよう!」を今日読み終えました。
検定ってなんじゃらほいっ?
検定とは、『母集団について、分析者が立てた仮説が、正しいかどうかを 標本のデータから、推測する分析手法』とのことです。
検定にも色々種類があって、
独立性、同一性、相関比、無相関、母平均の差、母比率の差がでてきましたが、
ここでは、主に独立性の検定が説明されてます。
独立性の検定って、6章でやったデータ間の関連性について、関係が全く無いかどうかを検証するというのが、私の理解です。例えば、デブって汗かきってよくいうけど(私もちょい太ってたときは比較的汗かきになりました)、「デブは(本当は)汗かきじゃない」という仮説を一旦設定して、それが実際は間違っている、または正しくてもそれは●%しか言えない、というのをわざわざ検証するようなもので、そんなの役に立つの?と思いました。
この検証をやるのに、有意水準やらピアソンのカイ二乗統計量、帰無仮説・対立仮説とか、また難しい言葉がいっぱい出てくるけど、ステップに沿ってやることにより、楽しく学ぶことができました。
以上で、この本は終了です。
成果はよく分かりませんが、データの種類、雰囲気を知る、ばらつきや基準化、関連性なんかの感覚は身に付いたと思います。
ここから、どのように実務で使えるようになるかというのは、これからまだ勉強を進めていく必要があります。
日常や仕事、色んな投資(事業や金融商品等)で統計をさらっと使えるようになると何となくカッコいいと私は感じますので、引き続き頑張っていこうと思います。
次回からは、日科技連の『統計のはなし』(大村平著)です。