Rの続きです。
2つの質的変数(ここでは「病気」「性別」)が独立か?を調べるというものです。
1)データを変数へ格納(結果のみ表示)
> mydata2
id sex disease
1 1 男 有
2 2 男 有
3 3 男 有
4 4 男 無
5 5 男 無
6 6 男 無
7 7 女 有
8 8 女 有
9 9 女 有
10 10 女 有
11 11 女 無
12 12 女 無
13 13 女 無
2)クロス集計表作成
> table(mydata2$sex,mydata2$disease)
無 有
女 3 4
男 3 3
3)カイ2乗検定
> chisq.test(table(mydata2$sex,mydata2$disease),correct=F)
Pearson's Chi-squared test
data: table(mydata2$sex, mydata2$disease)
X-squared = 0.066327, df = 1, p-value = 0.7968
Warning message:
In chisq.test(table(mydata2$sex, mydata2$disease), correct = F) :
カイ自乗近似は不正確かもしれません
結論:病気に性差はない(但しサンプル数が少なすぎるため警告あり)
4)フィッシャーの正確検定
> fisher.test(table(mydata2$sex,mydata2$disease))
Fisher's Exact Test for Count Data
data: table(mydata2$sex, mydata2$disease)
p-value = 1
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.05228419 10.67349535
sample estimates:
odds ratio
0.7668651
結論:病気に性差はない
>>>>
教科書の例題と回答でも確認してみました。
「ある銀行が融資先企業200社に対して、その企業の戦略が
優れているか否かを判定した。優れた企業戦略と企業業績に
関連があるか有意水準5%で検定しなさい」
業績悪/業績良 計
----------------------------------------
戦略悪:45/45 90
戦略優:30/80 110
----------------------------------------
75/125 200
1)クロス集計表を変数へ格納
> table82=matrix(c(45,30,45,80),2,2)
> table82
[,1] [,2]
[1,] 45 45
[2,] 30 80
2)カイ2乗検定
> chisq.test(table82,correct=F)
Pearson's Chi-squared test
data: table82
X-squared = 10.909, df = 1, p-value = 0.0009569
結論;企業戦略と企業戦略には関連がある(=独立を棄却)
>>>
「3都市で、都市と商品の好みに関連があるかを調べるため
4商品A・B・C・Dのどれが一番好きかの調査を行った。
都市と商品の好みに関連があるか有意水準5%で検定しなさい」
東京/大阪/福岡 計
------------------------------
A:36/14/14 64
B:10/10/10 30
C:21/14/15 50
D:18/27/11 56
------------------------------
85/65/50 200
1)クロス集計表を変数へ格納
> table812=matrix(c(36,10,21,18,14,10,14,27,14,10,15,11),4,3)
> table812
[,1] [,2] [,3]
[1,] 36 14 14
[2,] 10 10 10
[3,] 21 14 15
[4,] 18 27 11
2)カイ2乗検定
> chisq.test(table812,correct=F)
Pearson's Chi-squared test
data: table812
X-squared = 13.879, df = 6, p-value = 0.03102
結論:都市と商品の好みに関連がある(=独立を棄却)
2つの質的変数(ここでは「病気」「性別」)が独立か?を調べるというものです。
1)データを変数へ格納(結果のみ表示)
> mydata2
id sex disease
1 1 男 有
2 2 男 有
3 3 男 有
4 4 男 無
5 5 男 無
6 6 男 無
7 7 女 有
8 8 女 有
9 9 女 有
10 10 女 有
11 11 女 無
12 12 女 無
13 13 女 無
2)クロス集計表作成
> table(mydata2$sex,mydata2$disease)
無 有
女 3 4
男 3 3
3)カイ2乗検定
> chisq.test(table(mydata2$sex,mydata2$disease),correct=F)
Pearson's Chi-squared test
data: table(mydata2$sex, mydata2$disease)
X-squared = 0.066327, df = 1, p-value = 0.7968
Warning message:
In chisq.test(table(mydata2$sex, mydata2$disease), correct = F) :
カイ自乗近似は不正確かもしれません
結論:病気に性差はない(但しサンプル数が少なすぎるため警告あり)
4)フィッシャーの正確検定
> fisher.test(table(mydata2$sex,mydata2$disease))
Fisher's Exact Test for Count Data
data: table(mydata2$sex, mydata2$disease)
p-value = 1
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.05228419 10.67349535
sample estimates:
odds ratio
0.7668651
結論:病気に性差はない
>>>>
教科書の例題と回答でも確認してみました。
「ある銀行が融資先企業200社に対して、その企業の戦略が
優れているか否かを判定した。優れた企業戦略と企業業績に
関連があるか有意水準5%で検定しなさい」
業績悪/業績良 計
----------------------------------------
戦略悪:45/45 90
戦略優:30/80 110
----------------------------------------
75/125 200
1)クロス集計表を変数へ格納
> table82=matrix(c(45,30,45,80),2,2)
> table82
[,1] [,2]
[1,] 45 45
[2,] 30 80
2)カイ2乗検定
> chisq.test(table82,correct=F)
Pearson's Chi-squared test
data: table82
X-squared = 10.909, df = 1, p-value = 0.0009569
結論;企業戦略と企業戦略には関連がある(=独立を棄却)
>>>
「3都市で、都市と商品の好みに関連があるかを調べるため
4商品A・B・C・Dのどれが一番好きかの調査を行った。
都市と商品の好みに関連があるか有意水準5%で検定しなさい」
東京/大阪/福岡 計
------------------------------
A:36/14/14 64
B:10/10/10 30
C:21/14/15 50
D:18/27/11 56
------------------------------
85/65/50 200
1)クロス集計表を変数へ格納
> table812=matrix(c(36,10,21,18,14,10,14,27,14,10,15,11),4,3)
> table812
[,1] [,2] [,3]
[1,] 36 14 14
[2,] 10 10 10
[3,] 21 14 15
[4,] 18 27 11
2)カイ2乗検定
> chisq.test(table812,correct=F)
Pearson's Chi-squared test
data: table812
X-squared = 13.879, df = 6, p-value = 0.03102
結論:都市と商品の好みに関連がある(=独立を棄却)