No.11717 正規分布について  【ファルコン】 2010/01/17(Sun) 20:18

正規分布の工程能力の調査方法についてですが,とある製品特性をサンプリングする際に,同一作業,測定条件で,正規分布と判明するには,サンプル数は最低50個といろいろな書籍には書いてありますが,その根拠等をご存知の方がおればご教授願います。

No.11720 Re: 正規分布について  【正規分布について】 2010/01/17(Sun) 21:24

クイックリスポンス感謝します。
例えば,「よくわかるこれからの品質管理(同文館出版 山田正美)」P148ですね。後は,http://cache.yahoofs.jp/search/cache?p=%E5%B7%A5%E7%A8%8B%E8%83%BD%E5%8A%9B%E3%80%80%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AA%E3%83%B3%E3%82%B0%E6%95%B0&ei=UTF-8&fr=top_ga1_sa&x=wrt&u=members.jcom.home.ne.jp/tojo-tetsuo2/toolbox/38.doc&w=%22%E5%B7%A5%E7%A8%8B+%E8%83%BD%E5%8A%9B%22+%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AA%E3%83%B3%E3%82%B0+%E6%95%B0&d=IJXLvt29UGSr&icp=1&.intl=jp
にも記載されています。

根拠をご存知であればご教授願います。

No.11721 Re: 正規分布について  【青木繁伸】 2010/01/17(Sun) 21:35

失礼しました,ちょっと,コメント記事を削除してしまいました。

削除した記事は,以下の通り

> 正規分布と判明するには,サンプル数は最低50個といろいろな書籍には書いてありますが

たとえば,どのような書籍でしょうか?
そもそも,検定で,「正規分布に従う」という結論は出せないと思うのですけど?
「最 低50個」って,じゃあ,「5億個のデータを使ったら,正規分布に従うと確実に言える」と思いますか。案に相違して,「そんなにたくさんデータ集めたら正 規分布じゃないと言うことになってしまうでしょ」ということなんですよ。データが多くなれば,どんな小さな相違もチェックしてしまう。
シャピロ・ ウィルク検定だと,1,2,3,4,5 という5つのデータだと「正規分布だ」という帰無仮説は棄却できません。1,2,3,...,50 という50個のデータでも「正規分布だ」という帰無仮説は棄却できません。1,2,3,...,52 という52個のデータなら,やっと「正規分布だ」という帰無仮説は棄却されます。でも,どのデータも,ちっとも正規分布に従ってなんかいないと思うでしょ う?
> shapiro.test(1:5) # 1,2,3,4,5 という5個のデータは正規分布に従うか?

Shapiro-Wilk normality test

data: 1:5
W = 0.9868, p-value = 0.9672 # 帰無仮説は棄却できない

> shapiro.test(1:50) # 1,2,...,48,49,50 という50個のデータは正規分布に従うか?

Shapiro-Wilk normality test

data: 1:50
W = 0.9556, p-value = 0.05809 # 帰無仮説は棄却できない

> shapiro.test(1:52) # 1,2,...,50,51,52 という52個のデータは正規分布に従うか?

Shapiro-Wilk normality test

data: 1:52
W = 0.9555, p-value = 0.04999 # 帰無仮説はギリギリで棄却できた!!
==================
ちょっとピントが外れていました。

しかし,正規性検定もいろいろあり,検出力も様々です。
しかし,検定によって,「ある分布に従う」という結論が得られないというのは,どんな検定法を採用しようが同じです。

No.11722 Re: 正規分布について  【青木繁伸】 2010/01/17(Sun) 21:45

dagoTest だと,独立な一様分布に従う2変数の和の分布は三角分布だけど,サンプルサイズ200でも正規分布に従うという帰無仮説を棄却できる確率は50%位です。shapiro.test だと36%くらいしかありませんね。
>library(fBasics)
> n = 10000; sum(replicate(n, dagoTest(runif(200)+runif(200))@test$p.value[1] <0.05))/n
[1] 0.4818
> n = 10000; sum(replicate(n, shapiro.test(runif(200)+runif(200))$p.value[1] <0.05))/n
[1] 0.3569
正規分布に近いけど正規分布でないものを,正規分布ではないとはいいきれず,正規分布かもしれないなあと受け入れてしまうことのいかに多いことよという嘆きかな。

No.11728 Re: 正規分布について  【ファルコン】 2010/01/18(Mon) 00:10

いろいろ検証していただきありがとうございます。
結論としては,上記書籍やURLにおける最低サンプルサイズ50というのは正しくないと言い切ってもよろしいのでしょうか?
再度,その他の文献を調べると「一般的に最低サンプルサイズは○○です」という非論理的表現が見られたので,経験則で成り立っているのでしょうかね?

No.11731 Re: 正規分布について  【青木繁伸】 2010/01/18(Mon) 06:55

連続的に変化するものだから,何事も50未満ならだめで50以上ならオーケーというような,ある数値を境にどうだこうだということは言えないでしょう。

また繰り返しますが【検定によって,「ある分布に従う」という結論は得られない】ということですよ。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る