No.09911 中央値を各個人の代表値として分散分析を行うことについて  【かめ】 2009/05/22(Fri) 21:15

 被験者内2要因のデータ(いずれの要因も水準数は2)について,次の手順で分析を行いました。まず,個人のデータに含ま れる外れ値の影響を抑えるために,各被験者の代表値として水準ごとに算出した中央値を求めました。次いで,水準ごとの平均値を代表値として用いました。そ の上で,2要因の分散分析を行いました。
 このように分析をしたデータを論文にして投稿したところ,2名の査読者のうちの一方から,中央値を各被 験者の代表値として分散分析を行った点についてクレームがきました。わたし自身はこの点に問題はないと考えておりますが,いかがでしょうか。どなたか,ご 教示いただけますと幸いです。

どうぞ,よろしくお願いいたします。

No.09912 Re: 中央値を各個人の代表値として分散分析を行うことについて  【青木繁伸】 2009/05/22(Fri) 21:47

データがどういうものであるかにつて,説明はまだ不十分だと思います。

> まず,個人のデータに含まれる外れ値の影響を抑えるために,各被験者の代表値として水準ごとに算出した中央値を求めました。次いで,水準ごとの平均値を代表値として用いました。

> 中央値を各被験者の代表値として分散分析を行った点についてクレームがきました

分析対象の変数は,比尺度?間隔尺度?順序尺度?
個人ごとの複数のデータの中央値を一つのデータとして,そのデータを用いて通常の分散分析を行ったと言うことでしょうか?

なぜ,ノンパラメトリックな指標と,パラメトリックな指標を混在させるのだろうかというのが一般的な反応ではないでしょうか?

No.09915 Re: 中央値を各個人の代表値として分散分析を行うことについて  【かめ】 2009/05/22(Fri) 22:40

ご返信いただきありがとうございます。説明不足であったことをお詫びいたします。

>分析対象の変数は,比尺度?間隔尺度?順序尺度?

比例尺度(反応時間)となります。

>個人ごとの複数のデータの中央値を一つのデータとして,そのデータを用いて通常の分散分析を行ったと言うことでしょうか?

おっしゃるとおりです。被験者数が20であれば,20人分の中央値のデータを用いて,通常の分散分析を行ったということです。

>ノンパラメトリックな指標と,パラメトリックな指標を混在させるのだろうかというのが一般的な反応ではないでしょうか?

外れ値の影響を抑える目的で中央値を使いましたが,もちろん,先生のおっしゃることは,そのとおりだと思います。その上で,質問させていただいたやり方が,分析方法として誤りかどうかを教えていただけないでしょうか。
どうぞ,よろしくお願いいたします。

No.09916 Re: 中央値を各個人の代表値として分散分析を行うことについて  【青木繁伸】 2009/05/22(Fri) 22:49

> 被験者数が20であれば,20人分の中央値のデータを用いて,通常の分散分析を行ったということです。

まだよくわかりませんね。
20人分のデータを一つのデータ(中央値)にしたということですか?「二十人分のデータであった」ということはどこかに生かされているのですか?

元のデータを使う(ケース数 n も)のが,大原則ですよね。

No.09917 Re: 中央値を各個人の代表値として分散分析を行うことについて  【青木繁伸】 2009/05/22(Fri) 22:50

> その上で,質問させていただいたやり方が,分析方法として誤りかどうかを

誤りかどうかということまでいかないかも知れないが,不適切であることは確かなように思います。

No.09918 Re: 中央値を各個人の代表値として分散分析を行うことについて  【かめ】 2009/05/23(Sat) 15:49

>20人分のデータを一つのデータ(中央値)にしたということですか?「二十人分のデータであった」ということはどこかに生かされているのですか?

いえ,違います。状況を正しくお伝えできず申し訳ありません。

個人に対して同じ作業を16回行わせ,得られた16個の反応時間の中央値を算出して,個人の代表値といたしました。同様の処置を20名それぞれについて行いました。この20名のデータを通常の分散分析にかけました。

この場合でも,やはり不適切でしょうか?

No.09919 Re: 中央値を各個人の代表値として分散分析を行うことについて  【青木繁伸】 2009/05/23(Sat) 18:12

安定したデータを使いたいということで中央値を使ったのでしょうが,16回もやる必要があるのかはなはだ疑問。そ んなに外れ値が出やすい測定法・測定値なのかとも思いますけど。そうであったとしても,中央値を使うなら5,6回で十分という気もします。それに,16回 もやったのだし,その16個のデータを全部使うべきでしょう。例えば,外れ値があまりでないような場合で,3回繰り返したという場合,3個のデータ全部使 おうということになりますよね。ちょうど真ん中のデータだけを使って分析したら,「なぜ全部使わないのか?」と言われると思います。基本的には測定は1回 だけのほうが実験デザインはすっきりしますね。先行研究などの分析例にないデータの取り方をするといろいろ面倒が生じると思います。

No.09920 Re: 中央値を各個人の代表値として分散分析を行うことについて  【かめ】 2009/05/23(Sat) 20:34

何度も丁寧に回答していただき,ありがとうございます。

>16回もやる必要があるのかはなはだ疑問。

質問させていただいたデータが,人の認知過程を調べたものであり,個人の反応のゆらぎが大きい(16試行でも回数としては決して多くない)という事情がございました。

>先行研究などの分析例にないデータの取り方をするといろいろ面倒が生じると思います。
おっしゃるとおりですね。わたし自身も,もう少し考えてみたいと思います。

No.09921 Re: 中央値を各個人の代表値として分散分析を行うことについて  【青木繁伸】 2009/05/23(Sat) 20:52

n人に16回の測定をしてその中央値を取ってn個のデータを得るよりは,n×16人の人に1回ずつの測定をしてn×16個のデータを得るほうがよいのではないかと思ったりします(本当にそうなのかどうかは,知りませんが)。

No.09930 Re: 中央値を各個人の代表値として分散分析を行うことについて  【かめ】 2009/05/25(Mon) 20:18

返信が遅れて申し訳ありません。
回答していただき,ありがとうございます。

>n人に16回の測定をしてその中央値を取ってn個のデータを得るよりは,n×16人の人に1回ずつの測定をしてn×16個のデータを得るほうがよいのではないかと思ったりします

もしかしたら,ご提案いただいたやり方の方がより良いのもかもしれません。ただ,この場合,集める被験者数が膨大になるため現実に実施することは難しそうです・・。

また,ここで質問させていただいたことと直接関連するのかどうか分からないのですが,もう1つ質問をさせていただけますでしょうか。

今回のように,個人について複数個のデータを得て,その代表値を分析に用いる場合,個人内のデータ(上記の例で言えば16個の反応時間)の正規性は問題になるでしょうか?

No.09934 Re: 中央値を各個人の代表値として分散分析を行うことについて  【青木繁伸】 2009/05/25(Mon) 21:26

> 個人について複数個のデータを得て,その代表値を分析に用いる場合,個人内のデータ(上記の例で言えば16個の反応時間)の正規性は問題になるでしょうか?

何を持って代表値とするかということですから,正規分布に従うなら,平均値=中央値=最頻値でしょうし,その他の分布型なら,最頻値にするか,中央値にするかということでしょうね。分布型に依存するのは当然でしょう。

No.09935 Re: 中央値を各個人の代表値として分散分析を行うことについて  【かめ】 2009/05/25(Mon) 21:33

>何を持って代表値とするかということですから,正規分布に従うなら,平均値=中央値=最頻値でしょうし,その他の分布型なら,最頻値にするか,中央値にするかということでしょうね。分布型に依存するのは当然でしょう。

なるほど,おっしゃるとおりですね。ありがとうございます。ここで教えていただいたことを踏まえて,また自分で上の問題を考えて見ます。その上で,改めて質問させていただくかも知れません。そのときは,どうぞよろしくお願いいたします。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る