No.04778 外れ値の棄却について  【Soneda】 2007/11/22(Thu) 16:41

私は,統計初心者のsonedaといいます.
今回,10人の被験者の触刺激に対する反応速度を調べるべく,各人10個のデータを取得する実験を行いました.
(1)取得データ(グループ1)は各人ごとの平均値・分散から,グラブズ・スミルノフの棄却検定に基づき外れ値を算出し,その外れ値をデータから取り除いた後に,全体の平均値と分散を再計算しました(サンプルサイズは減ります).
(2)刺激の入射方向により,反応速度に差異があるかを調べるため,同一被験者で入射方向を変えたデータ(グループ2,3とする)も取得しました.平均値の計算は(1)と同様です.
(3)(2)で得られた結果をもとに,ペリの方法で棄却検定を行います.

上記の方法で検定を行い,反応速度が刺激の入射方向に依存するかどうかを述べたいのですが,
手順に心配があります.
心配1.グラブズ・スミルノフの棄却検定後に多重比較法を用いることでの,検定の多重性は?
心配2.ノンパラメトリック方は外れ値に対し,頑健性を持つので,外れ値の検定自体が必要ない?
心配3.そもそもなぜノンパラメトリック法は頑健性をもつのか?

どなたか,多重性・システムの頑健性について,参考になる文献等ありましたら,お教え下さい.

No.04780 Re: 外れ値の棄却について  【青木繁伸】 2007/11/22(Thu) 17:12

たとえば,ある入射方向についてのデータは,aさんのデータのうち8個,bさんのデータの6個,,,みたいな感じでなりたっているのでしょうか?
統計学の基礎的な前提(データは独立である)に反しているのではないかと心配ですね。

> そもそもなぜノンパラメトリック法は頑健性をもつのか?

実際のデータではなく順位を使うからでしょ?

実際のデータが,1, 3, 6, 9, 11 の場合の順位は 1, 2, 3, 4, 5
実際のデータが,1, 3, 6, 9, 999999 の場合であっても順位は 1, 2, 3, 4, 5
平均値はそれぞれ 30 と 1000018 ですから大違いです。

対応のない場合の平均値の差の検定をすると,P = 0.3739 ですが,
マン・ホイットニーの U 検定では P = 1.000 です。
両方とも帰無仮説は採択されるものの,大違いです。

No.04783 Re: 外れ値の棄却について  【Soneda】 2007/11/22(Thu) 17:57

早速のお返事ありがとうございます.
>統計学の基礎的な前提(データは独立である)に反しているのではないか?
先生のおっしゃる通り,被験者ごとに検定に用いるデータの大きさは異なります.
先生のおっしゃっていることをかみ砕きますと,外れ値とみなした棄却を行うことは,データ自体が棄却域にいてはいけないことを示し,つまり,データの独立性が損なわれるということでよろしいですか?

>ノンパラメトリック法
頑健性の説明ありがとうございます.検定自体は,パラメトリック法のペリの方法を用いましたので,その性質をうっかり忘れていました.

私のような初心者にも,度々の返信ありがとうございました.

No.04786 Re: 外れ値の棄却について  【青木繁伸】 2007/11/22(Thu) 18:22

> 外れ値とみなした棄却を行うことは,データ自体が棄却域にいてはいけないことを示し,つまり,データの独立性が損なわれるということでよろしいですか

そういうことではなく,データの中に同じ人のデータが複数個含まれるということです。
必ず同じ個数含まれるということならそれなりの分析方法があり,同じ個数でない場合でも,分析は可能です。しかし,特別な分析をせずに,同じ人の複数個のデータを別の人の1個ずつのデータと同じ扱いにするのは不適切だということです。

a さんの4つのデータを a1, a2, a3, a4, bさんの3つのデータをb1, b2, b3, cさんの5つのデータをc1, c2, c3, c4 として全部で12個のデータとして扱うのと,12人のデータとして扱うのでは意味が異なってくるでしょうということです。

No. 4749 からのスレッドも参照。これは,外れ値がないので繰り返し数が同じ例ではあるが,内在する問題点は同じ。

No.04787 Re: 外れ値の棄却について  【Soneda】 2007/11/22(Thu) 20:27

青木先生のコメントと,No.4749を拝見し,ようやく問題点を理解いたしました.
データ整理の中で気にはなっていたのですが,スッキリさせないまま結果を求めてしまい間違いを生んでしまったように思えます.
まだ,勉強不足であることを痛感せずにはいられません.
今回もありがとうございました.

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る