No.03102 Re: t検定に関する初歩的な質問 【DISIR】 2007/04/01(Sun) 12:05
t検定というのはt分布を使うからです。分散が既知でなくわからないときにどうするかゴセットが考えたものではないでしょうか。
中心極限定理によってどんな確率分布でも十分に回数を重ねれば標準偏差ではなく正規分布が正しいのでは?t検定は小標本のために作られたのだから,大標本でしか使えないのでは意味ないのでは?
No.03103 Re: t検定に関する初歩的な質問 【青木繁伸】 2007/04/01(Sun) 13:15
シミュレーション実験をしてみれば納得できるでしょう。
以下のような R プログラムで,n を両群からのサンプルサイズとして,t検定を行ってそのt値のヒストグラムを描いて,自由度が 2n-2 のt分布の確率密度曲線を重ねて見ましょう。なお,以下のシミュレーションでは,母分布は「一様分布」であるところに注目。loop <- 1000
n <- 5
x <- matrix(runif(n*loop, min=50, max=100), n)
y <- matrix(runif(n*loop, min=50, max=100), n)
ans <- sapply(1:loop, function(i) t.test(x[,i], y[,i], var.equal=TRUE)$statistic)
hist(ans, breaks=20, probability=TRUE, xlab="t", main="", ylim=c(0, dt(0, df=2*n-2)))
x <- seq(-5, 5, length=200)
y <- dt(x, df=2*n-2)
lines(x, y)
No.03113 Re: t検定に関する初歩的な質問 【s】 2007/04/03(Tue) 19:47
ご教示ありがとうございます。
Rはちょっとわからないです。
Excelやマクロ程度までなら分かるのですが。
このt分布というのは分散が分からない時に使うのですか?
標本から母分散を推定すると分散がばらつきますよね?
抜き取った標本が小さいとき,得られる分散ばらつくからそれを考慮しようということでしょうか?
分散の分散を考慮するとt分布になると理解してよいですか?
標本より分散を得る,分散がばらつくことを考慮して母分散の推定値に幅を持たせる。
この幅のある母分散に基づいて区間推定を行うと解釈してよいですか?
● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る