No.15047 正規性について  【統計初心者】 2011/07/30(Sat) 10:21

お忙しいところ申し訳ありませんが,質問があります。
正規性について調べているのですが,データ数が多い場合は, 中心極限原理によって正規分布にこだわる必要はないそうなのですが,データ数が多い場合というのは,正確にはどの位の数のデータがあれば良いのか?また, データ数が多くても正規性の検定を行って,正規性がないとされた場合,パラメトリック検定は行わない方が良いのか?の2点を教えて下さい。基本的なことで 申し訳ありませんが,なかなか前に進めず困っています。宜しくお願いいたします。

No.15049 Re: 正規性について  【青木繁伸】 2011/07/30(Sat) 10:37

> データ数が多い場合というのは,正確にはどの位の数のデータがあれば良いのか

明確な基準があるわけではありません。近似が不十分な段階から,十分な段階まで,じりじりと変化していくわけです。昔は,「データが数十個あればよい」などと,いい加減なことがいわれていました。

> データ数が多くても正規性の検定を行って,正規性がないとされた場合,パラメトリック検定は行わない方が良いのか

ま あ,教科書的にいえばそういうことでしょう。ただ,(あなたは暗黙に,検定といえば平均値の差の検定を意図しているようですが),いわゆるt検定は,正規 性については頑健性があるとはいわれます。また,一般的には,同じ母集団から抽出されたデータでも,サンプルサイズが小さい場合には正規分布するという帰 無仮説が採択されても,サンプルサイズが大きくなっていくと帰無仮説が棄却されることが多くなるという,検定が本質的に持っている特質も考慮しておく必要 があるでしょう。

No.15052 Re: 正規性について  【統計初心者】 2011/07/30(Sat) 17:22

ありがとうございます。
サンプル数は130程度あります。確かに正規性の検定を行っても棄却されてしまいます。一度ヒストグラムを作成し偏りの程度を確認するのと,パラメトリック,ノンパラメトリックの両方でどれ位違いがあるのか確認しながら進めてみようと思います。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る