例題:
「母不良率が 3% であるはずの生産工程から,製品 20 個を取り出したとき,不良品が 2 個あった。母不良率が 3% から変化しているかどうか検定しなさい。」
R による解析:
> chisq.test(c(2, 18), p=c(0.03, 0.97)) Chi-squared test for given probabilities data: c(2, 18) X-squared = 3.3677, df = 1, p-value = 0.06649 Warning message: In chisq.test(c(2, 18), p = c(0.03, 0.97)) : カイ自乗近似は不正確かもしれません > prop.test(2, 20, p=0.03, correct=FALSE) 1-sample proportions test without continuity correction data: 2 out of 20, null probability 0.03 X-squared = 3.3677, df = 1, p-value = 0.06649 alternative hypothesis: true p is not equal to 0.03 95 percent confidence interval: 0.02786648 0.30103365 sample estimates: p 0.1 Warning message: In prop.test(2, 20, p = 0.03, correct = FALSE) : カイ自乗近似は不正確かもしれません
注1:
$Z_0 = \displaystyle \frac{|\ p-\pi_0\ |}{\sqrt{\pi_0\ (1-\pi_0)\ /\ n}}$によって計算される検定統計量は,以下のように,X-squared の平方根を取ったものに等しい。どちらにしろ,得られる p-value は同じ値になる。
> ans <- chisq.test(c(2, 18), p=c(0.03, 0.97)) Warning message: In chisq.test(c(2, 18), p = c(0.03, 0.97)) : カイ自乗近似は不正確かもしれません > sqrt(ans$statistic) X-squared 1.835129> ans$p.value [1] 0.06648661 注2:chisq.test で検定を行うのはお勧めではない。prop.test はデフォルトで連続性の補正をするので,以下のように検定を行う方がよい。
> prop.test(2, 20, p=0.03) 1-sample proportions test with continuity correction data: 2 out of 20, null probability 0.03 X-squared = 1.3918, df = 1, p-value = 0.2381 alternative hypothesis: true p is not equal to 0.03 95 percent confidence interval: 0.01751264 0.33127760 sample estimates: p 0.1 Warning message: In prop.test(2, 20, p = 0.03) : カイ自乗近似は不正確かもしれません注3:また,どのような場合にも,正確な検定(二項検定)を行うほうがよい。
> binom.test(2, 20, p=0.03) Exact binomial test data: 2 and 20 number of successes = 2, number of trials = 20, p-value = 0.1198 alternative hypothesis: true probability of success is not equal to 0.03 95 percent confidence interval: 0.01234853 0.31698271 sample estimates: probability of success 0.1