No.04155 カイ二乗・F分布の使用意義  【凛】 2007/08/16(Thu) 16:16

統計の勉強を始めたばかりの者です。

勉強していて,疑問に感じたのですが,確率変数の推定・検定の際に,母分散が既知なら標準化して正規分布で,母分散が未知ならt分布で,という事は分かったのですが,カイ二乗分布と,F分布は,いつ,どういう状況で使うものなのでしょうか。
解き方は理解できるのですが,何故,それを使うのか,という事について,教えていただけないでしょうか。

また,タイトルとは話が変わるのですが,標本数nが分布表に載っていない数字の場合,どうしたらよいのでしょうか。
中途半端な数字だったり,1000などと言う数字だったりするのですが,単に表にある最も近い値を入れておけば大丈夫なのでしょうか。

よろしくお願いします。

No.04156 Re: カイ二乗・F分布の使用意義  【青木繁伸】 2007/08/16(Thu) 17:24

> 確率変数の推定・検定の際

> 正規分布で,母分散が未知ならt分布で

確率変数の何を推定・検定するのでしょうか?
それぞれに応じて利用する分布は異なってきます。

> 標本数nが分布表に載っていない数字の場合

ここでの「標本数」という言葉の使い方は間違っています。「標本の大きさ(サンプルサイズ)」と言うべきです。

それはさておき,
そのような場合にはコンピュータを使えばよいです
Excel の normdist, norminv, tdist, tinv, chidist, chiinv, fdist, finv などの一連の関数を調べてみればよいでしょう

面倒でしたら,
http://aoki2.si.gunma-u.ac.jp/CGI-BIN/distribution.html
なんかで,計算することもできます。

No.04157 Re: カイ二乗・F分布の使用意義  【凛】 2007/08/16(Thu) 17:48

> 確率変数の何を推定・検定するのでしょうか?

正規分布,t分布は母平均μの推定・検定をする際に使われると思います。
ただ,カイ二乗分布,F分布を「どこで,何を出すために」使うのかがよく分からないのです。
上手く言葉が見つかりません。申し訳ありません。

> ここでの「標本数」という言葉の使い方は間違っています。「標本の大きさ(サンプルサイズ)」と言うべきです。

分かりました。ありがとうございます。

No.04158 Re: カイ二乗・F分布の使用意義  【青木繁伸】 2007/08/16(Thu) 18:08

> カイ二乗分布,F分布を「どこで,何を出すために」使うのかがよく分からないのです。

学習を進めていけばそのうち出てきますよ
なお,t分布だって,母平均の検定・推定だけに使われるのではありません
http://aoki2.si.gunma-u.ac.jp/lecture/tests.html
には,様々な検定・推定についての目次があります。
それぞれを見れば,どの分布が使われているか分かります。

> 文書の問題なので,コンピュータは使えないのです
そうですか。試験問題かなんかで,実際その問題を解くときにコンピュータが使えないということですか。

自由度が120以上なら自由度が∞の所を見ればよろしいでしょう。
そうでなくて,たとえば自由度が37なのに自由度が40と30のときの値しかないなどと言うときには,自由度の逆数で補間します。補間については,
http://aoki2.si.gunma-u.ac.jp/lecture/Hokan/hokan.html
http://aoki2.si.gunma-u.ac.jp/lecture/Hokan/hokan2.html

学習ならばそれでよいと思いますが,実践ではコンピュータを使う方が良いですよ。
学習に使っている教科書にP値を求めることについては載っていないのでしょうね。
P値に言及しない検定というのは,旧式になっています。

> データが実際に存在し,その上で,と言うわけではなく,「このサンプルサイズの平均値が,分散が,」とあるだけで,その上文書の問題なので,コンピュータは使えないのです。

が よく分かりませんが,実際のデータが無くて文章問題であってもコンピュータを使えますよ。「53人の身長の平均値が 157.8 cm,不偏分散が 24.6 であった。母平均が 156.2 cm であるかどうかを,有意水準 5% で検定しなさい。」というような問題なんでしょ?

と いうか,あなたが最初に聞いたのは「標本数nが分布表に載っていない数字の場合どうしたらよいか」というのはたぶん自由度がmのときのα=5%のときの数 値がないということでしょ?そう言うときにExcelの tinv 関数を使えばたとえば =tinv(m,0.05,2) であなたの知りたい数値を求められますよということです。

とにかく,現代の統計学で,学習時にはともかく,実戦でコンピュータを使わないやり方はナンセンスです。

No.04159 Re: カイ二乗・F分布の使用意義  【凛】 2007/08/16(Thu) 19:08

> 学習を進めていけばそのうち出てきますよ

わかりました。進めて行ってみます。

> 自由度の逆数で補間します。

なるほど,こういったやり方があるのですね。
ありがとうございます。

> 学習に使っている教科書にP値を求めることについては載っていないのでしょうね。

索引で調べてみたところ,古い本でもないようなのですが,P値についての記載はありませんでした。
後ほど何かで調べておこうと思います。

色々とご教授頂き,ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る