No.09134 対応のあるt検定について  【AC】 2009/02/05(Thu) 18:56

お世話になります。以下のデータのような2セットについて,対応のあるt検定を行いました。
x1 <- c(2200, 2100, 2690, 450, 1490)
y1 <- c(495, 520, 860, 300, 450)

x2 <- c(1100, 950, 900, 2100, 1570)
y2 <-c(1050, 820, 780, 1930, 1340)

t.test(x1, y1, paired=TRUE)
> p-value = 0.01504

t.test(x2, y2, paired=TRUE)
> p-value = 0.009176
と もに有意差が出ますが,2セット目の方がP値が小さいです。しかし,図示すると,明らかに1セット目の方が,「傾き」が大きいというか,変化量が大きいで す。印象としては,1セット目の方が,小さいP値が出るのかなと思うのですが,paired t-testはそういうものなのでしょうか。
 あるいは,この図のように「一定傾向のある変化量」が重要である際に,それを検定する適切な手法はありますでしょうか。


No.09135 Re: 対応のあるt検定について  【青木繁伸】 2009/02/05(Thu) 19:35

> 明らかに1セット目の方が,「傾き」が大きいというか,変化量が大きいです

差をプロットしてみましょう。
第1セットの方は,差も大きいけど散らばりも大きい。
他のスレッドにも述べたが,「検定よりは,区間推定」ということで,R で計算されている区間推定の結果を見ると良いでしょう。
> x1 <- c(2200, 2100, 2690, 450, 1490)
> y1 <- c(495, 520, 860, 300, 450)
> d1 <- x1-y1
> mean(d1)
[1] 1261
> sd(d1)
[1] 690.2572
> x2 <- c(1100, 950, 900, 2100, 1570)
> y2 <-c(1050, 820, 780, 1930, 1340)
> d2 <- x2-y2
> mean(d2)
[1] 140
> sd(d2)
[1] 66.3325
> plot(rep(1:2, each=5), c(d1, d2), xaxt="n", xlab="",
+ ylab="差", xlim=c(0,3), pch=19)

> t.test(x1, y1, paired=TRUE)

Paired t-test

data: x1 and y1
t = 4.085, df = 4, p-value = 0.01504
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
403.9325 2118.0675 # 差の平均は大きいけど,区間も広い
sample estimates: # 0は含まれない
mean of the differences
1261 # 差の平均

> #> p-value = 0.01504
>
> t.test(x2, y2, paired=TRUE)

Paired t-test

data: x2 and y2
t = 4.7194, df = 4, p-value = 0.009176
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
57.63733 222.36267 # 差の平均は小さいが,区間も狭い
sample estimates: # 0 は含まれない
mean of the differences
140 # 差の平均

> #> p-value = 0.009176


No.09136 Re: 対応のあるt検定について  【AC】 2009/02/05(Thu) 20:29

早速のご返答ありがとうございます。
確かに信頼区間が広いなという印象はありました。ここで,セット1の4つめのデータ450を1400に変えて検定したら,以下のようになり,2セット目よりP値が小さくなりました。
> x1 <- c(2200, 2100, 2690, 1400, 1490)
> y1 <- c(495, 520, 860, 300, 450)
>
> t.test(x1, y1, paired=TRUE)

Paired t-test

data: x1 and y1
t = 9.0255, df = 4, p-value = 0.0008347
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
1004.639 1897.361
sample estimates:
mean of the differences
1451
結局のところ,サンプルサイズが小さいために,ひとつのデータに足を引っ張られてしまったということですね。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る