今後講義中に取ったメモをブログに載せていきます。
とりいそぎ2009/05/16の計量分析前半分。
【オススメ書籍】
ホーエル 初等統計学 培風館 村上訳
http://www.amazon.co.jp/%E5%88%9D%E7%AD%89%E7%B5%B1%E8%A8%88%E5%AD%A6-%E3%83%9D%E3%83%BC%E3%83%AB-G-%E3%83%9B%E3%83%BC%E3%82%A8%E3%83%AB/dp/4563008397
【確率】
1・離散型(ADUで扱う)
2・連続型(ADUでは扱わない)
[キーワード]
確率
確率密度(ProbabilityDensity)
確率分布
累積分布関数(累積確率関数)
※参考URL
http://dsl4.eee.u-ryukyu.ac.jp/DOCS/error/node15.html
F(x)=Pr(X<=x)となる確率(XはUQ)
離散型はグラフ横軸の右端にxがあり、Fはxまでに離散している値の確率の累積値、つまりxの確率密度である。
⊿←の右端がx、つまりFと思えばいい。
連続型はグラフ横軸中央にxがある。Fはxまでに連続している値の積分値である。
⊿←の面積がFと思えばいい。
【確率分布の特性値】
1・中心的位置
1-1・分布の平均値(Average)、
1-2・最頻値(Mode)
1-3・中央値(Median)※テキスト中では0.50分位点
2・散らばり
2-1・標準偏差(StandardDeviation)√(Σ(x-x~)^2*P(x))
分散(Σ(x-x~)^2*P(x))(Variance)が大きい
2-2・平均偏差 ABSΣ(x-x~) 絶対値化する。分散(Variance)が小さい
2-3・四分位偏差 (semi inter-quartile range; SIQR)
中央値を含む四分位を指す。これが大きければ、ダラっと横長のグラフ。
※参考URL
http://excel.onushi.com/function/quartile.htm
2-4・レンジ(四分位偏差に同じ)
※覚えておくと良いこと(テキストP169)ただし、単峰分布のグラフに限る。
1・平均から標準偏差の距離(最も値が集合している部分)以外の値の総数は全体の1/3程度である。
2・標準偏差の値を3倍すると、そこには値がほとんど無い。
【ベイズ統計学】
ベイズ理論を実装した簡単なBASICのプログラムを渡します。