「統計学関連なんでもあり」の過去ログ---011

★ 標準誤差に関する初歩的な質問 ★

　75　標準誤差に関する初歩的な質問　　林　　2000/11/14 (火) 23:10
　　85　Re: 標準誤差に関する初歩的な質問　　nobody　　2000/11/15 (水) 11:38
　　84　Re: 標準誤差に関する初歩的な質問　　てんとうむし　　2000/11/15 (水) 10:34
　　　86　Re^2: 標準誤差に関する初歩的な質問　　nobody　　2000/11/15 (水) 11:54
　　　　94　Re^3: 標準誤差に関する初歩的な質問　　てんとうむし　　2000/11/15 (水) 13:01
　　77　Re: 標準誤差に関する初歩的な質問　　nobody　　2000/11/14 (火) 23:40
　　　81　Re^2: 標準誤差に関する初歩的な質問　　林　　2000/11/15 (水) 03:10
　　　　87　Re^3: 標準誤差に関する初歩的な質問　　nobody　　2000/11/15 (水) 12:03
　　　　　89　Re^4: 標準誤差に関する初歩的な質問　　nobody　　2000/11/15 (水) 12:23
　　　　　　97　Re^5: 標準誤差に関する初歩的な質問　　林　　2000/11/15 (水) 23:06
　　　　83　Re^3: 標準誤差に関する初歩的な質問　　てんとうむし　　2000/11/15 (水) 10:27

75.　標準誤差に関する初歩的な質問　　林　　2000/11/14 (火) 23:10

私の理解では標準誤差とは標本平均のちらばりを示し，荒っぽくいえば，何度もサンプリングを実施しその度にサンプルの平均を計算すると，その平均は正規分布し，母分散/(標本数^0.5)の標準偏差を持ち，それを標準誤差と呼ぶ，というものです。

しかるに，http://psyc.queensu.ca/~flanagan/202_1999/lecture12/lecture12.html なるサイトで見つけた"A random sample of 50 patients showed a mean waiting time of 23.4 minutes and a standard deviation of 7.1 minutes. Find a 95% confidence interval for μ."という問の答えとして，23.4-1.96*7.1/sqrt(50)<μ< 23.4+ 1.96*7.1/sqrt(50)とありました。

ここでいうstandard deviationというのは，50サンプルの標準偏差であり，50サンプルの平均値の標準偏差ではないと思われ，私の理解と異なります。同じような例に他の機会にも遭遇し，私の理解が本当に正しいのか自信がなくなってまいりました。どなたかご教示頂けますとありがたく存じます。

私は海外駐在員で，必要あって統計を初歩から独学しているものです。

　　　　　[このページのトップへ]

85.　Re: 標準誤差に関する初歩的な質問　　nobody　　2000/11/15 (水) 11:38

>しかるに，http://psyc.queensu.ca/~flanagan/202_1999/lecture12/lecture12.html なるサイトで見つけた

"A random sample of 50 patients showed a mean waiting time of 23.4 minutes and a standard deviation of 7.1 minutes. Find a 95% confidence interval for μ."という問の答えとして，23.4-1.96*7.1/sqrt(50)<μ< 23.4+ 1.96*7.1/sqrt(50)とありました。

> ここでいうstandard deviationというのは，50サンプルの標準偏差であり，

このページは，母分散が既知の場合の信頼区間の求め方（あるいはその近似法）なのですね。ですから，上の（近似）式でOKです。

たとえば，
http://www.math.uni.edu/~campbell/stat/inf1.html
では，ちゃんと sigma という記号を使って，
*sigma* is the standard deviation of the population.
と明確に書いてあります。

あなたの提示したページではそのあたりがぼやけている。同じように母標準偏差を表すσと言う記号を使っているのに，それをいつのまにか標本標準偏差にすり替えている。

#正確に言うと，最初のコメントのように，t分布を使います。

　　　　　[このページのトップへ]

84.　Re: 標準誤差に関する初歩的な質問　　てんとうむし　　2000/11/15 (水) 10:34

> 23.4-1.96*7.1/sqrt(50)<μ< 23.4+ 1.96*7.1/sqrt(50)とありました。

これってきっと，23.4-2.78×7.1/sqrt(50))<μ< 23.4+ 2.78×7.1/sqrt(50)じゃないかなぁ?　2.78は危険率5%のt値です。

　　　　　[このページのトップへ]

86.　Re^2: 標準誤差に関する初歩的な質問　　nobody　　2000/11/15 (水) 11:54

> これってきっと，23.4-2.78×7.1/sqrt(50))<μ< 23.4+ 2.78×7.1/sqrt(50)じゃないかなぁ?
2.78は危険率5%のt値です。

2.78 ですか?　2.009574018じゃないですか?（自由度49，両側確率0.05)
23.4-2.009574018×7.1/sqrt(50))<μ< 23.4+ 2.009574018×7.1/sqrt(50)
21.38220355<μ<25.41779645（95%信頼区間）

http://www.ruf.rice.edu/~lane/hyperstat/B7483.html
に"When σ is not known..."について書いてあります。
SMの定義が今ひとつ不明確だが。

　　　　　[このページのトップへ]

94.　Re^3: 標準誤差に関する初歩的な質問　　てんとうむし　　2000/11/15 (水) 13:01

> 2.78 ですか?　2.009574018じゃないですか?

ホントだ!　t表の違う値を見ていました。すみません。

　　　　　[このページのトップへ]

77.　Re: 標準誤差に関する初歩的な質問　　nobody　　2000/11/14 (火) 23:40

> ここでいうstandard deviationというのは，50サンプルの標準偏差であり，50サンプルの平均値の標準偏差ではないと思われ，私の理解と異なります。同じような例に他の機会にも遭遇し，私の理解が本当に正しいのか自信がなくなってまいりました。どなたかご教示頂けますとありがたく存じます。

ちゃんとした統計学の教科書を参照なさることをお勧めします。
母平均値の(1-α)信頼限界値は，
標本平均±【自由度が標本の大きさマイナス1のt分布のα/2パーセント点】×【平方根（不偏分散/標本の大きさ）】
です。
引用された英語の説明では正規分布のパーセント点を使っていますが，それは近似解です。
正規分布のパーセント点を使うのは，「母分散が既知の場合」です。

ごった煮状態ですね。

　　　　　[このページのトップへ]

81.　Re^2: 標準誤差に関する初歩的な質問　　林　　2000/11/15 (水) 03:10

> 母平均値の(1-α)信頼限界値は，
> 標本平均±【自由度が標本の大きさマイナス1のt分布のα/2パーセント点】×【平方根（不偏分散/標本の大きさ）】です。

あほな質問かもしれませんが，上の式にある「不偏分散」とは標本の不偏分散ですか?

例の問題は，母集団から50個サンプルを（1回だけ）抽出して，その平均が23.4，（50個のサンプルの）標準偏差が7.1という結果をもとに母平均の信頼区間を求めています。私が考えたのは，母集団の信頼区間を求めるには，50サンプル抽出する作業を何度も（例えば100回）繰り返して，その度に平均値を取り，100個の平均値の標準偏差を計算する必要がある（そうやって標準誤差を求め，その標準誤差とt分布あるいは正規分布のパーセント点を使って，母平均の信頼区間を求める）のではないか，ということです。おっしゃる「不偏分散」が標本の不偏分散だとすると，私の理解は誤りということになりますね。

　　　　　[このページのトップへ]

87.　Re^3: 標準誤差に関する初歩的な質問　　nobody　　2000/11/15 (水) 12:03

> > 母平均値の(1-α)信頼限界値は，
> > 標本平均±【自由度が標本の大きさマイナス1のt分布のα/2パーセント点】×【平方根（不偏分散/標本の大きさ）】です。
>
> あほな質問かもしれませんが，上の式にある「不偏分散」とは標本の不偏分散ですか?
>
> 例の問題は，母集団から50個サンプルを（1回だけ）抽出して，その平均が23.4，（50個のサンプルの）標準偏差が7.1という結果をもとに母平均の信頼区間を求めています。私が考えたのは，母集団の信頼区間を求めるには，50サンプル抽出する作業を何度も（例えば100回）繰り返して，その度に平均値を取り，100個の平均値の標準偏差を計算する必要がある（そうやって標準誤差を求め

そんな風にして標準誤差を求めるのではないです。
あなたの見たページにも書いてあるように，
標本平均の標準誤差は「母標準偏差/sqrt(データ数)」で「推定される」のです。
そして，たいていの場合は母標準偏差は未知であることが多いので，それさえも標本標準偏差で「推定しなくてはならない」のです。どのように推定するかは正確な方法から近似的な方法まであります。

　　　　　[このページのトップへ]

89.　Re^4: 標準誤差に関する初歩的な質問　　nobody　　2000/11/15 (水) 12:23

同時進行中の別スレッドで示した以下のページを読むと少しは整理できるかな（よけい混乱するかもしれないが）

http://www.medical-tribune.co.jp/mtbackno3/3308/08hp/M3308151.htm

　　　　　[このページのトップへ]

97.　Re^5: 標準誤差に関する初歩的な質問　　林　　2000/11/15 (水) 23:06

nobodyさん，てんとうむしさん，ありがとうございました。おかげさまで大分頭の整理がつきました。「標準誤差とは何か」という議論と，その概念を使ってどう母平均の区間推定をするかという目的論的な議論とが私の中で完全にごっちゃになっていました。それと母標準偏差の近似値として標本標準偏差を使っているところと。お騒がせ致しました。

　　　　　[このページのトップへ]

83.　Re^3: 標準誤差に関する初歩的な質問　　てんとうむし　　2000/11/15 (水) 10:27

> 上の式にある「不偏分散」とは標本の不偏分散ですか?

「不偏分散」は，母分散の不偏推定量でしょうから，標本データから得られた「分散」だと思いますよ。

> 50サンプル抽出する作業を何度も（例えば100回）繰り返して，その度に平均値を取り，100個の平均値の標準偏差を計算する必要がある（そうやって標準誤差を求め，その標準誤差とt分布あるいは正規分布のパーセント点を使って，母平均の信頼区間を求める）のではないか，ということです。

たぶんこれは，何度も同じ実験を繰り返した場合の標本平均の分布を求めていることになるのではないでしょうか?　母平均というのは定数ですから，分布などしないで一点に定まる値でしょう?　母平均の区間推定をするというのは，実験から得られた標本平均と分散を元に，「100-α%の確率で母平均はこれこれの間に存在する」ということを言うためのものだと思います。
私はこう理解しているのですが，いかがでしょう?

　　　　　[このページのトップへ]