No.03099 t検定に関する初歩的な質問  【s】 2007/03/31(Sat) 11:30

統計学初心者です。
t検定についての初歩的な質問があります。

t検定は標本数が少ない時に使用しますが,
このt検定で想定している確率分布は正規分布なのでしょうか?

また,標本数が多いときは,得られる分散の触れ幅が小さくなるから正規分布で近似してよく,小さい場合は分散が大きくなるのでt表を使うとのことですが。
このt表はどのような根拠で作成されるのでしょうか?
中心極限定理によってどんな確率分布でも十分に回数を重ねれば標準偏差になるとのことですが,t表はかなり標本数が小さい場合も用意されていますよね。
標本数があまり小さいとならないような気もしますがどうなのでしょうか?

No.03102 Re: t検定に関する初歩的な質問  【DISIR】 2007/04/01(Sun) 12:05

t検定というのはt分布を使うからです。分散が既知でなくわからないときにどうするかゴセットが考えたものではないでしょうか。
中心極限定理によってどんな確率分布でも十分に回数を重ねれば標準偏差ではなく正規分布が正しいのでは?t検定は小標本のために作られたのだから,大標本でしか使えないのでは意味ないのでは?

No.03103 Re: t検定に関する初歩的な質問  【青木繁伸】 2007/04/01(Sun) 13:15

シミュレーション実験をしてみれば納得できるでしょう。
以下のような R プログラムで,n を両群からのサンプルサイズとして,t検定を行ってそのt値のヒストグラムを描いて,自由度が 2n-2 のt分布の確率密度曲線を重ねて見ましょう。なお,以下のシミュレーションでは,母分布は「一様分布」であるところに注目。
loop <- 1000
n <- 5
x <- matrix(runif(n*loop, min=50, max=100), n)
y <- matrix(runif(n*loop, min=50, max=100), n)
ans <- sapply(1:loop, function(i) t.test(x[,i], y[,i], var.equal=TRUE)$statistic)
hist(ans, breaks=20, probability=TRUE, xlab="t", main="", ylim=c(0, dt(0, df=2*n-2)))
x <- seq(-5, 5, length=200)
y <- dt(x, df=2*n-2)
lines(x, y)

fig


No.03113 Re: t検定に関する初歩的な質問  【s】 2007/04/03(Tue) 19:47

ご教示ありがとうございます。
Rはちょっとわからないです。
Excelやマクロ程度までなら分かるのですが。

このt分布というのは分散が分からない時に使うのですか?
標本から母分散を推定すると分散がばらつきますよね?
抜き取った標本が小さいとき,得られる分散ばらつくからそれを考慮しようということでしょうか?
分散の分散を考慮するとt分布になると理解してよいですか?

標本より分散を得る,分散がばらつくことを考慮して母分散の推定値に幅を持たせる。
この幅のある母分散に基づいて区間推定を行うと解釈してよいですか?

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る