Rの続きです。

2つの質的変数(ここでは「病気」「性別」)が独立か?を調べるというものです。


1)データを変数へ格納(結果のみ表示)
> mydata2
id sex disease
1 1 男 有
2 2 男 有
3 3 男 有
4 4 男 無
5 5 男 無
6 6 男 無
7 7 女 有
8 8 女 有
9 9 女 有
10 10 女 有
11 11 女 無
12 12 女 無
13 13 女 無


2)クロス集計表作成
> table(mydata2$sex,mydata2$disease)

無 有
女 3 4
男 3 3


3)カイ2乗検定
> chisq.test(table(mydata2$sex,mydata2$disease),correct=F)

Pearson's Chi-squared test

data: table(mydata2$sex, mydata2$disease)
X-squared = 0.066327, df = 1, p-value = 0.7968

Warning message:
In chisq.test(table(mydata2$sex, mydata2$disease), correct = F) :
カイ自乗近似は不正確かもしれません

結論:病気に性差はない(但しサンプル数が少なすぎるため警告あり)


4)フィッシャーの正確検定
> fisher.test(table(mydata2$sex,mydata2$disease))

Fisher's Exact Test for Count Data

data: table(mydata2$sex, mydata2$disease)
p-value = 1
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.05228419 10.67349535
sample estimates:
odds ratio
0.7668651

結論:病気に性差はない


>>>>

教科書の例題と回答でも確認してみました。

「ある銀行が融資先企業200社に対して、その企業の戦略が
 優れているか否かを判定した。優れた企業戦略と企業業績に
 関連があるか有意水準5%で検定しなさい」

      業績悪/業績良 計
----------------------------------------
  戦略悪:45/45   90
  戦略優:30/80   110
----------------------------------------
      75/125  200


1)クロス集計表を変数へ格納
> table82=matrix(c(45,30,45,80),2,2)
> table82
[,1] [,2]
[1,] 45 45
[2,] 30 80


2)カイ2乗検定
> chisq.test(table82,correct=F)

Pearson's Chi-squared test

data: table82
X-squared = 10.909, df = 1, p-value = 0.0009569

結論;企業戦略と企業戦略には関連がある(=独立を棄却)


>>>

「3都市で、都市と商品の好みに関連があるかを調べるため
 4商品A・B・C・Dのどれが一番好きかの調査を行った。
 都市と商品の好みに関連があるか有意水準5%で検定しなさい」

  東京/大阪/福岡 計
------------------------------
 A:36/14/14 64
 B:10/10/10 30
 C:21/14/15 50
 D:18/27/11 56
------------------------------
  85/65/50 200


1)クロス集計表を変数へ格納
> table812=matrix(c(36,10,21,18,14,10,14,27,14,10,15,11),4,3)
> table812
[,1] [,2] [,3]
[1,] 36 14 14
[2,] 10 10 10
[3,] 21 14 15
[4,] 18 27 11

2)カイ2乗検定
> chisq.test(table812,correct=F)

Pearson's Chi-squared test

data: table812
X-squared = 13.879, df = 6, p-value = 0.03102

結論:都市と商品の好みに関連がある(=独立を棄却)