外来端末の対応でやむなく・・・
仕事自体は19時半頃終わったのですが、
部署内で唯一の女性同僚である後輩とロッカーで1時間半立ち話をしてました(笑)
今からごはん食べてお風呂に入り、またRの練習をします。
21日間続けられたことは習慣になるそうなので、
時間がない時にも少しだけでも触るようにしたいと思います。
>>>
ただいま0時。
基礎統計の教科書の例題を使って検定をしてみました。
「異なる業種間で賃金格差が存在しているかどうかを調査するために
一部上場企業の金融業と製造業から総合職(入社5年目)の社員を
それぞれ10名ずつ無作為抽出したところ、彼らの年間賃金の
データ(単位100万円)は次のようになりました
金融:6.2/5.7/6.5/6.0/6.3/5.8/5.7/6.0/6.0/5.8
製造;5.6/5.9/5.6/5.7/5.8/5.7/6.0/5.5/5.7/5.5
業種間で賃金格差が存在しているかどうかを有意水準5%で
検定してみましょう。ただしどちらの業種ともそれぞれの母集団は
世紀母集団に従い、母集団の分散は等しいと仮定します」
1)「ex8.3.csv」に以下のデータを保存
chingin,shokusyu
6.2,kinyu
5.7,kinyu
6.5,kinyu
6,kinyu
6.3,kinyu
5.8,kinyu
5.7,kinyu
6,kinyu
6,kinyu
5.8,kinyu
5.6,seizo
5.9,seizo
5.6,seizo
5.7,seizo
5.8,seizo
5.7,seizo
6,seizo
5.5,seizo
5.7,seizo
5.5,seizo
2)Rでcsvファイル読み込み
>mydata80=read.csv("ex8.3.csv")
3)t検定(等分散)実行
>t.test(mydata80$chingin~mydata80$shokusyu,var.equal=T)
Two Sample t-test
data: mydata80$chingin by mydata80$shokusyu
t = 3.0339, df = 18, p-value = 0.007139
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.09225527 0.50774473
sample estimates:
mean in group kinyu mean in group seizo
6.0 5.7
4)等分散性の検定
>var.test(mydata80$chingin~mydata80$shokusyu)
F test to compare two variances
data: mydata80$chingin by mydata80$shokusyu
F = 2.6667, num df = 9, denom df = 9, p-value = 0.1601
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.6623623 10.7359844
sample estimates:
ratio of variances
2.666667
<<<
p値だけを見て
「業種間に差あり・金融業が高い」「分散は等しい」
と読み取るだけでOK?
・・・なのかよくわからず~
仕事自体は19時半頃終わったのですが、
部署内で唯一の女性同僚である後輩とロッカーで1時間半立ち話をしてました(笑)
今からごはん食べてお風呂に入り、またRの練習をします。
21日間続けられたことは習慣になるそうなので、
時間がない時にも少しだけでも触るようにしたいと思います。
>>>
ただいま0時。
基礎統計の教科書の例題を使って検定をしてみました。
「異なる業種間で賃金格差が存在しているかどうかを調査するために
一部上場企業の金融業と製造業から総合職(入社5年目)の社員を
それぞれ10名ずつ無作為抽出したところ、彼らの年間賃金の
データ(単位100万円)は次のようになりました
金融:6.2/5.7/6.5/6.0/6.3/5.8/5.7/6.0/6.0/5.8
製造;5.6/5.9/5.6/5.7/5.8/5.7/6.0/5.5/5.7/5.5
業種間で賃金格差が存在しているかどうかを有意水準5%で
検定してみましょう。ただしどちらの業種ともそれぞれの母集団は
世紀母集団に従い、母集団の分散は等しいと仮定します」
1)「ex8.3.csv」に以下のデータを保存
chingin,shokusyu
6.2,kinyu
5.7,kinyu
6.5,kinyu
6,kinyu
6.3,kinyu
5.8,kinyu
5.7,kinyu
6,kinyu
6,kinyu
5.8,kinyu
5.6,seizo
5.9,seizo
5.6,seizo
5.7,seizo
5.8,seizo
5.7,seizo
6,seizo
5.5,seizo
5.7,seizo
5.5,seizo
2)Rでcsvファイル読み込み
>mydata80=read.csv("ex8.3.csv")
3)t検定(等分散)実行
>t.test(mydata80$chingin~mydata80$shokusyu,var.equal=T)
Two Sample t-test
data: mydata80$chingin by mydata80$shokusyu
t = 3.0339, df = 18, p-value = 0.007139
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.09225527 0.50774473
sample estimates:
mean in group kinyu mean in group seizo
6.0 5.7
4)等分散性の検定
>var.test(mydata80$chingin~mydata80$shokusyu)
F test to compare two variances
data: mydata80$chingin by mydata80$shokusyu
F = 2.6667, num df = 9, denom df = 9, p-value = 0.1601
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.6623623 10.7359844
sample estimates:
ratio of variances
2.666667
<<<
p値だけを見て
「業種間に差あり・金融業が高い」「分散は等しい」
と読み取るだけでOK?
・・・なのかよくわからず~