No.04780 Re: 外れ値の棄却について 【青木繁伸】 2007/11/22(Thu) 17:12
たとえば,ある入射方向についてのデータは,aさんのデータのうち8個,bさんのデータの6個,,,みたいな感じでなりたっているのでしょうか?
統計学の基礎的な前提(データは独立である)に反しているのではないかと心配ですね。
> そもそもなぜノンパラメトリック法は頑健性をもつのか?
実際のデータではなく順位を使うからでしょ?
実際のデータが,1, 3, 6, 9, 11 の場合の順位は 1, 2, 3, 4, 5
実際のデータが,1, 3, 6, 9, 999999 の場合であっても順位は 1, 2, 3, 4, 5
平均値はそれぞれ 30 と 1000018 ですから大違いです。
対応のない場合の平均値の差の検定をすると,P = 0.3739 ですが,
マン・ホイットニーの U 検定では P = 1.000 です。
両方とも帰無仮説は採択されるものの,大違いです。
No.04783 Re: 外れ値の棄却について 【Soneda】 2007/11/22(Thu) 17:57
早速のお返事ありがとうございます.
>統計学の基礎的な前提(データは独立である)に反しているのではないか?
先生のおっしゃる通り,被験者ごとに検定に用いるデータの大きさは異なります.
先生のおっしゃっていることをかみ砕きますと,外れ値とみなした棄却を行うことは,データ自体が棄却域にいてはいけないことを示し,つまり,データの独立性が損なわれるということでよろしいですか?
>ノンパラメトリック法
頑健性の説明ありがとうございます.検定自体は,パラメトリック法のペリの方法を用いましたので,その性質をうっかり忘れていました.
私のような初心者にも,度々の返信ありがとうございました.
No.04786 Re: 外れ値の棄却について 【青木繁伸】 2007/11/22(Thu) 18:22
> 外れ値とみなした棄却を行うことは,データ自体が棄却域にいてはいけないことを示し,つまり,データの独立性が損なわれるということでよろしいですか
そういうことではなく,データの中に同じ人のデータが複数個含まれるということです。
必ず同じ個数含まれるということならそれなりの分析方法があり,同じ個数でない場合でも,分析は可能です。しかし,特別な分析をせずに,同じ人の複数個のデータを別の人の1個ずつのデータと同じ扱いにするのは不適切だということです。
a さんの4つのデータを a1, a2, a3, a4, bさんの3つのデータをb1, b2, b3, cさんの5つのデータをc1, c2, c3, c4 として全部で12個のデータとして扱うのと,12人のデータとして扱うのでは意味が異なってくるでしょうということです。
No. 4749 からのスレッドも参照。これは,外れ値がないので繰り返し数が同じ例ではあるが,内在する問題点は同じ。
No.04787 Re: 外れ値の棄却について 【Soneda】 2007/11/22(Thu) 20:27
青木先生のコメントと,No.4749を拝見し,ようやく問題点を理解いたしました.
データ整理の中で気にはなっていたのですが,スッキリさせないまま結果を求めてしまい間違いを生んでしまったように思えます.
まだ,勉強不足であることを痛感せずにはいられません.
今回もありがとうございました.
● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る