No.02768 n=2の場合の検定  【suzuki】 2007/02/19(Mon) 12:51

n数が3未満の場合,t検定や分散分析を適用できないのでしょうか?
例えば,以下のような検定は何れも行うことはできないのでしょうか?

「餌の種類により肝臓の重量の母平均値に差があるといえるか」
(1)各群n=2のt検定
A餌 3.42 3.84
B餌 3.17 3.63

(2)各群n=2の一元配置分散分析
A餌 3.42 3.84
B餌 3.17 3.63
C餌 3.64 3.72

(3)繰り返しのない二元配置の分散分析(要因Aの水準数2,要因Bの水準数2)
B1 B2
A1 3.42 3.84
A2 3.17 3.63

参考 http://aoki2.si.gunma-u.ac.jp/lecture/Average/oneway-ANOVA.html

No.02770 Re: n=2の場合の検定  【青木繁伸】 2007/02/19(Mon) 13:35

(1)〜(3),全部できますよ
> t.test(c(3.42, 3.84), c(3.17, 3.63))

Welch Two Sample t-test

data: c(3.42, 3.84) and c(3.17, 3.63)
t = 0.7385, df = 1.984, p-value = 0.5377
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.120678 1.580678
sample estimates:
mean of x mean of y
3.63 3.40

> oneway.test(c(3.42, 3.84, 3.17, 3.63, 3.64, 3.72) ~ rep(1:3, each=2))

One-way analysis of means (not assuming equal variances)

data: c(3.42, 3.84, 3.17, 3.63, 3.64, 3.72) and rep(1:3, each = 2)
F = 0.5022, num df = 2.000, denom df = 1.418, p-value = 0.6841

> df <- data.frame(y=c(3.42, 3.84, 3.17, 3.63),
+ f1=c("A1", "A1", "A2", "A2"),
+ f2=c("B1", "B2", "B1", "B2"))
> summary(aov(y ~ f1+f2, df))
Df Sum Sq Mean Sq F value Pr(>F)
f1 1 0.0529 0.0529 132.25 0.05522 .
f2 1 0.1936 0.1936 484.00 0.02892 *
Residuals 1 0.0004 0.0004
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

No.02773 Re: n=2の場合の検定  【monica】 2007/02/19(Mon) 15:10

パラメトリック検定では最低n=3数が必要と聞いていたのですが,2でも可能なのですね。

No.02774 Re: n=2の場合の検定  【青木繁伸】 2007/02/19(Mon) 15:31

> 2でも可能なのですね

この掲示板でも何回か同じ回答をしましたが,「検定できる」ということと「それが妥当である」というのは違いますから。

例えば,独立二標本の平均値の差の検定においては,等分散を仮定する検定の場合には,片方の群のデータ数が1であっても,検定はできます。
> t.test(c(1,3,2,4,3), 1, var.equal=TRUE)

Two Sample t-test

data: c(1, 3, 2, 4, 3) and 1
t = 1.281, df = 4, p-value = 0.2694
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.867779 5.067779
sample estimates:
mean of x mean of y
2.6 1.0
しかし,等分散を仮定しない Welch の方法による場合には,検定はできません(2個以上のデータが必要です)。
> t.test(c(1,3,2,4,3), 1, var.equal=FALSE)
以下にエラーt.test.default(c(1, 3, 2, 4, 3), 1, var.equal = FALSE) :
not enough 'y' observations

検定ができるかできないかは,検定の計算式をみればわかります。
0で,割り算をすることになるとか,自由度が0になるというようなことがおこると,検定はできないことになるんですね。

な お,ノンパラメトリック検定において,臨界値(有意になるときの統計量の値)の数値表で対応する箇所が「ー」あるいは空白などになっているときには,その ようなデータ数では指定された有意確率のもとで有意になることがないことを示しているだけで,検定ができないわけではありません。

No.02776 Re: n=2の場合の検定  【Kido】 2007/02/19(Mon) 18:31

monicaさんと同様私もパラメトリック検定は最低3だと思っていました。パラメトリック検定は分布による検定なのだから,分布が描けない数(n<3)で検定するのは論理的におかしいと思います。nが1,2で分布が描けますか?

No.02778 Re: n=2の場合の検定  【青木繁伸】 2007/02/19(Mon) 18:44

> 分布が描けない数(n<3)で検定するのは論理的におかしいと思います。nが1,2で分布が描けますか?

「分布が描けない」ということをどのようにとらえるかにもよりますが,では,n が3なら,分布が描けるのでしょうか?

「母分布が推定できないじゃないか」ということでしたら,母分布は推定するものではないし,
「標本から計算した平均値や標準偏差が信頼できないじゃないか」ということでしたら,そのような誤差も考慮して,有意確率が決められるのだし,
「2つや3つのデータから,そんなことがいえるはずがない」ということでしたら,それも,偶然性や誤差を考慮して標本調査の妥当性を確立したのが近代統計学だし,

No.02779 Re: n=2の場合の検定  【青木繁伸】 2007/02/19(Mon) 18:51

前のコメントにも書いたように,「検定ができる」ということと「それが妥当である」ということは違います。
妥当というのは,「意味がある」といってもよいけど,そのような検定は「検出力が非常に低い」(場合によってはほぼ0)ということですよ。検出力が低いのはデータ数が1や2でなくても,3でも4でも,5でもあり得る。

No.02780 Re: n=2の場合の検定  【青木繁伸】 2007/02/19(Mon) 19:32

標準正規母集団から各群あたり2〜50個のデータを抽出して検定を行うとして,検出力がどのようになるかを図示してみます。effect size が 0.2(small),0.5(medium), 0.8(large) の3通りを示した。
effect size が 0.8 というと,わかりやすいか誤解を招くかわからないが,センター試験の成績を偏差値で表したとすると 8 点の差です。そんなに大きな差ではない。でも,それでも large と評価されるくらいの差です。
サンプルサイズが2でも3でも,5でも,目くそ鼻くそ。

fig


No.02781 Re: n=2の場合の検定  【青木繁伸】 2007/02/19(Mon) 19:46

以前のスレッドのプログラムを若干修正して,n1=n2=2 で,平均値は同じだが分散比が異なる正規母集団からのデータについて,平均値の差の検定を行うことについてシミュレーションした。
n1=n2=2 などという極端な場合には,分散比が 1/4〜4 の間だと,等分散を仮定したt検定の方が第一種の過誤は0.05で安定しているのだなあ。
マン・ホイットニーのU検定は,当たり前だが,有意になることは,確率0だ。

fig


● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る