No.02030 パラメトリック検定の条件  【波音】 2006/12/26(Tue) 01:35

二群の平均値の差の検定を行う前に等分散性の検定を行うことは,どの統計学の参考書にも載っている基本事項だと思います。 また,ノンパラメトリック検定とパラメトリック検定の説明において,ノンパラメトリック検定は母集団分布に依存しないが,パラメトリック検定は母集団分布 が正規分布に従っていると仮定できなければならない,という解説が述べられていると思います。

そこで今更ながら疑問に思ったのですが,パ ラメトリック検定(例えば二群の平均値の差の検定の場合)は「母集団分布の正規性が仮定できる」かつ「二群の母集団の分散が等しい」というのが条件なので すか?それとも"かつ"ではなく"あるいは"なのでしょうか?つまりはどちらか一方が当てはまればパラメトリック検定を用いてよいかどうかということで す。

最初にいったように,検定の前に「等分散性の検定を行いなさい」という説明はありますが「正規性の検定をしなさい」という説明は聞い たことがありません。正規分布に従わない母集団からサンプリングしても標本分布が正規分布に従わないのは当たり前だから,そもそもパラメトリック検定を行 おうとするなら正規分布に従うであろう母集団を選びなさいということなのでしょうか。

そういうことであれば,標本は正規分布に従っている母集団から抽出したものであるからわざわざ正規性の検定など必要ない,だから等分散性の検定を行う。したがって,パラメトリック検定は「正規性」かつ「等分散性」ということで納得できますが。。。

No.02038 Re: パラメトリック検定の条件  【韮澤】 2006/12/27(Wed) 12:41

言い切る自信はないのですが・・・
私の理解している所では,パラメトリック検定の平均値の差の検定は,母集団が同じと見なせるかどうかの検定としての計算手法と同等になっていると思います。従って,平均値の差の検定においては,両方の母集団が正規分布であって,かつ,分散が等しい,という前提と思います。

ま た,中心極限定理によって,母集団の正規性に関係なく,標本分布は正規分布とみなせる。従って,標本から母集団の正規性を判断するのは無理ですから,デー タの性質などから,母集団が正規分布していると見なせるかを判断(仮定)する必要があると思っています。また,二群の母集団の分布が同じと判断できなけれ ば,分散が等しい事には意味がないと思います。

No.02041 Re: パラメトリック検定の条件  【波音】 2006/12/27(Wed) 18:44

回答ありがとうございます。・・・失礼ですが,韮澤(にらさわ)先生でよろしいのでしょうか。どうも漢字には弱くて(数字にも弱いのですが)。

やはり二群の母集団分布が正規分布であり,かつ,母分散が等しいと仮定できることが前提なのですね。

しかし,パラメトリック検定において母集団分布は正規分布であると"仮定"できればよいわけですが,そのように仮定するためにはやはりhttp://aoki2.si.gunma-u.ac.jp/lecture/GoodnessOfFitness/normaldist.htmlのように正規分布への適合度の検定を行うべきなのでしょうか。私が「正規性の検定」と曖昧な言い方をしてしまっていたのですが,この適合度の検定のことです。

No.02047 Re: パラメトリック検定の条件  【韮澤】 2006/12/28(Thu) 12:14

先生ではないですが,にらさわです。
χ二乗分布による検定は,一般に一枡の数の予測頻度が5以上である場 合のみと言われる通り,頻度の少ない所があると検定精度が落ちる弱点がありますが,正規分布への適合度検定に使うと,分布のすそ野部分が,必然的に予測頻 度が低くなる為,あまり精度があがりません。(簡単に,適合しないとの答えが出てしまいます。)それだけの話なら,フィッシャーの正確確率検定という手も ありますが,私の場合は,そもそも,区分して,検定するほどのサンプル数でない場合が多々あります。その為,分布の適合性は,歪度・尖度で判断するのがお 勧めで,個人的には±0.2で判断しています。さすが,青木先生が計算式も用意してくれています。

http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/sk.html
http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/kw.html

No.02056 Re: パラメトリック検定の条件  【波音】 2006/12/28(Thu) 23:22

なるほど。得られているデータ数が少ない場合は歪度と尖度で判断すべきなのですね。

しかし,それにしても,ただ教科書の手順どおりに検定を行って数値さえ出せば最低限は検定したといえるのでしょうが,細かい事を1つ1つ考えていくたびに統計学の難しさを感じます。使えて便利なものほど使いこなすのが難しいのはなんでも一緒なのですね。

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る