「統計」を簡単にまとめてみる | 女王様のブログ

女王様のブログ

ある女性教師の日常のこと,悩みや課題を率直に書いた,ぶっちゃけ話。

血迷って, 

骨の折れる講座を選択してしまったせいで,

3年生の担当でちょー多忙な中にあって,自分の首を絞めている状態が6月からきっと8月末まで続く。これもすべて, 斉藤兆史先生が講座を開講しないせいです。(嘘です)


3年生担当の忙しい毎日の上に,

隙間隙間に体を休めるまもなくおこなった, 統計学講座。(ここは小学校の卒業式の学校の思い出を児童が一人一人発表するように読んでいただきたい。)


ちなみに寺島先生のご郷里にある金沢大学にお世話になっています,余談。


まもなく試験がある関係で,

ざっくりと,簡単にここにまとめてみる。


その前に,


受験生の諸君

夏は受験の天王山


わたしのブログなど見ず, しっかり勉学に勤しみ, 後悔の無いように!



☆*゚ ゜゚*☆*゚ ゜゚*゚・*:.。..。.:*・゚゚・*:.。..。.:*・゚

本題に入る前に,

わたくしめの近況をすこし。

昨年の4月からの180℃の方向転換により,

あるクラスでは英検二級の合格が5人。みんな英語大好きな方々(大半は可愛すぎるおんにゃのこ,未だに免疫のない)を前にして,以前とは違い英語の需要が120%ある信じられない環境にいる関係で(英語教育関係者はウホウホなはず),サーキット場のカーレーサー並にわたくしめも頑張ばらざるをえない。

一昨日まで授業でヘトヘトになりながら・・・・ですが。


授業の後の放課後特別講座では,70名近くが私の講座を選択し,

そのままの肉声では限界があるので, 大学の先生みたいにマイクで授業しています。

一種のエンターテイメント並に実施しておりまする。


INTERMEDIATEには多くの学生が集うことに,先見の明がなく,

後から誰かと交換できないかとお願いに回って誰もいなくてこのままの状態で数ヶ月が過ぎて・・・おりまする。

何事も中くらいに人は集うもの。

高すぎず低すぎず,強すぎず弱すぎず。中庸。

ちなみに,マイクは謙虚に毎回全部自分でセッティングしています。


◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇

それでは,本題


その前にお断り,

以下はわたくしが自分自身の理解・把握の為に書いたもので,

これを読むであろう方々の理解を想定しておりませんのでご了承下さい。


不規則なデータから規則性を見いだす。


代表値(データの中心を表す) ー 平均値・中央値・最頻値

散布度(データのばらつきを表す) ー レンジ・標準偏差


レンジ ー データが存在するすべての範囲を表す

       *しかし, その中でデータがどのように分布しているかまでは分からない。 


①偏差とは? 平均値からどれだけズレているのかを表す値


偏差 = データの値ー平均値 


偏差のグラフは, 平均値が0としたものになる。


②偏差平方和 = (偏差)² の合計 全体のちらばりを評価する。


散らばりが大きい(小さい)方が, 偏差平方和は大きい(小さい)。

偏差平方和の問題点は, データの個数が異なる集団の散らばり具合は比較できない。



③分散 = (偏差)²の合計(すなわち偏差平方和のこと)/データ数

分散は, (偏差)²の平均値


ヒストグラムの分散の求め方


分散の別の形としては,


分散=(データの合計)²の合計/データ数ー(平均値)²


表計算ソフト(Excel)で分散を求められる。

VARP(又は,VAR.P)


④ 標準偏差とは分布のばらつきを知るための尺度の一つ

 標準偏差=√分散


⑤ 正規分布 規則正しい分布

 特徴その① 分布図が左右対称になっている

     その② 中央が平均値,中央値となる

     その③ 中央の平均値が一番多く現れる

     その④ 中央から離れると急激に少なくなる


    正規分布の式 N₀e - (x-x)²/2s²


 平均値 正規分布の中心が決まる

 標準偏差 正規分布の高さと広がりが決まる


  正規分布の値は,標準偏差の幅毎に小さくなる。


 正規分布標準偏差分 → 中央の値の約0.61

  標準偏差二つ分    → 中央の値の約0.41

  正規分布は必ずこの割合で減少する。


正規分布の幅 中心から標準偏差分の間には全体の68.3%のデータが含まれる。

中心から標準偏差分二つ分の間には全体の95.4%のデータが含まれる。

中心から標準偏差分三つ分の間には全体の99.7%のデータが含まれる。
 エクセルでの正規分布を表す関数はNORMDIST


正規分布の形は平均値と標準偏差によって決まる。


正規分布の値は標準偏差の幅毎に小さくなる。


(標準偏差の幅)Z値=得点ー平均/標準偏差


Z値がZ₀より小さい人の割合は  NORMDIST(Z₀)

Z値がZ₀より大きい人の割合は  1ーNORMDIST(Z₀)と計算され

る。

また,

(Z値がaからbまでの人の割合)=NORMDIST(b)ーNORMDIST(a)と計算される。

・ 標準正規分布表 の使い方

たとえば,

P(0<Z<1.0)を調べたい場合,Z=1.0のところを見てみると,

P(0<Z<1.0)=0.34134と分かる。

次にP(0<Z<0.49)を調べたい場合,Z=0.4の上の段に+0.09と書いてあるところがZ₀=0.49のところなので,

P(0<Z<0.49)=0.18793と分かる。


⑥正規分布から偏差値へ


(偏差値)=50+10×{(得点)ー(平均)/(標準偏差)} * {  }内はZ値

すなわち,偏差値はZ値を10倍して50を足したもの


まとめ

・偏差値とは,テストの難易度に関わらず得点を比べるようにした値

・偏差値は平均を50,標準偏差を10の正規分布をする。


⑦散布図について

二種類のデータの関連を視覚的に知る方法の一つ


たとえば,あるクラスの生徒の国語と英語の成績の散布図

とか,

生徒の学習時間と学力の関連

とか


Excelの表計算ソフトで散布図を作成

・以前やったヒストグラムのようにグラフの種類からかーんたんに作れちゃう優れもの。エクセルがすごいって言っているようなものですが・・・。(マイクロソフトの回し者?)


相関・相関係数

相関とは二つのデータの数値の変化がどれだけ似ているのかってこと。

相関の度合いを数値的に表すのが,相関係数.これを参考に,他教科との関連と,


・正の相関値の一方が高いものは他方も高く,低いものは低い) 右上がりに分布 関係数の値は1に近い


・負の相関 (どちらかの数値が高いものはもう一方は低い)

右下がりに分布 関係数の値はー1に近い


・相関なし ばらついた分布 相関がなく,相関係数は0に近い



学習時間等も含めて客観的に把握できそうだ。

現場の知見得られそう。

最初は確認テストで何度も落とされ現場の教員いじめとしか思えなかったが,金沢大学さまさま,感謝。