★ おしえてください。ノンパラメトリック統計について。 ★

 378 おしえてください。ノンパラメトリック統計について。  せん  2002/04/12 (金) 14:08
  379 Re: おしえてください。ノンパラメトリック統計について。  名無しさん  2002/04/12 (金) 16:48
   380 Re^2: おしえてください。ノンパラメトリック統計について。  せん  2002/04/12 (金) 18:15
    382 Re^3: おしえてください。ノンパラメトリック統計について。  名無しさん  2002/04/12 (金) 21:27
     400 Re^4: おしえてください。ノンパラメトリック統計について。  せん  2002/04/17 (水) 16:31
      403 Re^5: おしえてください。ノンパラメトリック統計について。  青木繁伸  2002/04/17 (水) 17:21
       411 Re^6: おしえてください。ノンパラメトリック統計について。  せん  2002/04/18 (木) 19:29


378. おしえてください。ノンパラメトリック統計について。  せん  2002/04/12 (金) 14:08
統計初心者で分散分析で苦労しています。いきなり具体的ですいませんが,装置A,B,Cで不良個数を調査し,装置に差があるか分散分析で求めようとしています。ただ,Aは不良個数が少なく,正規分布とは言い難いが,B,Cは,ヒストグラムを書くと正規分布のような感じになります。これらを同時に差があるか判断したいときには,どうすればよいでしょうか?また,扱っているデータが,正規分布かどうかよくわからないときは,すべてノンパラメトリック統計をしないとだめなのでしょうか?
具体例が書いてある参考書などありましたら,ぜひ教えてください。
よろしくお願いします。

     [このページのトップへ]


379. Re: おしえてください。ノンパラメトリック統計について。  名無しさん  2002/04/12 (金) 16:48
> 装置A,B,Cで不良個数を調査し,装置に差があるか分散分析で求めようとしています。ただ,Aは不良個数が少なく,正規分布とは言い難いが,B,Cは,ヒストグラムを書くと正規分布のような感じになります。

データは何なんですか。
装置A,B,C の不良個数って,装置A,B,C の三種がたくさんあって,その中の不良である装置の個数ですか。
それとも,装置A,B,C というのは製品か何か作り出すもので,その作り出されたものの中の不良個数ですか。
後者だとして,不良個数の分布ってことは,時間を区切って(たとえば一日あたり)の不良個数の分布と言うことですか。

データについてちゃんと書いてくれないと,答えようがないのではないでしょうか。

     [このページのトップへ]


380. Re^2: おしえてください。ノンパラメトリック統計について。  せん  2002/04/12 (金) 18:15
> それとも,装置A,B,C というのは製品か何か作り出すもので,その作り出されたものの中の不良個数ですか。
> 後者だとして,不良個数の分布ってことは,時間を区切って(たとえば一日あたり)の不良個数の分布と言うことですか。

言葉足らずで,すいませんでした。上記のとおり,装置A,B,Cは,製品を作っていて,1ロット(2万5000個)あたりの不良個数の分布です。

     [このページのトップへ]


382. Re^3: おしえてください。ノンパラメトリック統計について。  名無しさん  2002/04/12 (金) 21:27
> 装置A,B,Cは,製品を作っていて,1ロット(2万5000個)あたりの不良個数の分布です。

そんな条件の下にあって,検定は必要なのですか?
ロットを構成する個数が馬鹿に大きいし,ロットの個数もかなりあるのでしょう?
そんな大規模なサンプルはもはや「標本」ではなくて,「母集団」に近いでしょう。
全製品数をプールしてその中の不良品の割合を求めれば,それは母不良率と考えていいのではないでしょうか。
とすれば,ある装置の不良品生成率が別の装置に比べてどれだけ大きいかということをいうだけで,精度の記述はできると思いますが。

どうしても検定をやると言うことであれば,一つ指摘しておきます。
ノンパラメトリック検定は検出力が低いと思われがちですが,実際はそんなに検出力が低いわけではありません。335のコメントにも記述されていますが「クラスカル・ウォリス検定は,最強力なパラメトリック検定である一元配置分散分析と比較して3/π=95.5%の効率」です。
パラメトリック検定の条件を満たさないデータに,無理矢理パラメトリック検定を適用する必然性は認められないと思いますが。

     [このページのトップへ]


400. Re^4: おしえてください。ノンパラメトリック統計について。  せん  2002/04/17 (水) 16:31
返答ありがとうございました。
ついでに。。。
名無しさんのコメントで
>335のコメントにも記述されていますが「クラスカル・ウォリス検定は,最強力なパラメトリック検定である一元配置分散分析と比較して3/π=95.5%の効率」です。
パラメトリック検定の条件を満たさないデータに,無理矢理パラメトリック検定を適用する必然性は認められないと思いますが。

ということですが,つねにノンパラメトリック検定を使っていたほうがよいと思ってしまうのは,素人だからでしょうか?検出力の違いが大きな違いなのでしょうか?また。この辺勉強をしたいのですが,いい本がありましたら教えてください。よろしくお願いします。

     [このページのトップへ]


403. Re^5: おしえてください。ノンパラメトリック統計について。  青木繁伸  2002/04/17 (水) 17:21
> ということですが,つねにノンパラメトリック検定を使っていたほうがよいと思ってしまうのは,素人だからでしょうか?

私見ですが,やはり,いろいろ面倒な(必ずしも現実のデータで満たされていない)制約のあるパラメトリック検定を使って有意であるという結果を得ることと,そのような制約のないノンパラメトリック検定を使って有意であるといえるなら,後者の道をたどった方が得策ではないかということだと思います。
ただ,制約条件を満たしているデータについてまでなんでもかでもノンパラメトリック検定というのもこれまたステレオタイプなことなのでしょう。

>検出力の違いが大きな違いなのでしょうか?

検定においては,検出力というのは常に考えておいた方がいいと思います。
それは,パラメトリック検定を行う場合でも同じです。Power analysis の重要性は徐々に浸透していると思います。

     [このページのトップへ]


411. Re^6: おしえてください。ノンパラメトリック統計について。  せん  2002/04/18 (木) 19:29
ありがとうございました。
ご指摘の部分,今後の解析に活かしていきたいと思います。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 018 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る