★ 対応のあるデータか独立のデータか? ★

 424 対応のあるデータか独立のデータか?  悩める者  2003/05/21 (水) 19:37
  425 Re: 対応のあるデータか独立のデータか?  青木繁伸  2003/05/21 (水) 19:49
   428 Re^2: 対応のあるデータか独立のデータか?  悩める者  2003/05/21 (水) 22:03
    430 Re^3: 対応のあるデータか独立のデータか?  青木繁伸  2003/05/21 (水) 23:10
     436 Re^4: 対応のあるデータか独立のデータか?  悩める者  2003/05/22 (木) 19:30
    429 Re^3: 対応のあるデータか独立のデータか?  青木繁伸  2003/05/21 (水) 23:08
     435 Re^4: 対応のあるデータか独立のデータか?  悩める者  2003/05/22 (木) 19:00


424. 対応のあるデータか独立のデータか?  悩める者  2003/05/21 (水) 19:37
いつも大変参考にさせていただいております.
同じ疾患を持つ患者さんに対して,患者さん本人と第三者が同一の評価表を用いて,それぞれ現在の状況を評価するとします.その後,ご本人と第三者の評定値の間に
差があるかを検定する場合,両者のデータは独立したデータとしてみるべきか,対応しているとみるべきか,どちらが正しいのでしょうか?
評価する側から考えると,本人と第三者は別の集団なので,独立だと思うのですが,両者とも同じものを同じ方法で評価しているのだから,対応しているとみなせるのでは?との指摘を受けて,考え込んでしまいました.
どなたか,よろしくご教示ください.

     [このページのトップへ]


425. Re: 対応のあるデータか独立のデータか?  青木繁伸  2003/05/21 (水) 19:49
> 評価する側から考えると,本人と第三者は別の集団なので,独立だと思うのですが,両者とも同じものを同じ方法で評価しているのだから,対応しているとみなせるのでは?との指摘を受けて,考え込んでしまいました.


後者が正しい。

対応のあるデータか対応のないデータかを判断するときには,次のような質問をしてみるといいでしょう(両方の質問をする必要はない)。
「欠損値というものがないとき,二組みのデータの個数が違うということがあるだろうか」---同じこともあるけど,違うこともある(その方がよりあり得る)というなら,対応のないデータです。
「データを整理するときに並べ替えるとき,一方のデータだけを並べ替えてもいいだろうか」---かならずペアで並べ替えないといけないのなら,対応のあるデータです。

同じ人の状態を本人と第三者が評価するなら,本人の評価のデータ数と第三者の評価のデータ数はおなじですね。また,同じ人のデータですから,Aさん本人のデータと,Bさんの第三者の評価のペアを作っても何の意味もありません。

ということで,二つの質問のいずれを使っても,これは「対応のあるデータ」であるということがわかりますね。

     [このページのトップへ]


428. Re^2: 対応のあるデータか独立のデータか?  悩める者  2003/05/21 (水) 22:03
> ということで,二つの質問のいずれを使っても,これは「対応のあるデータ」であるということがわかりますね。

なるほど.ありがとうございます.大変よく分かりました.

ただ,1つ疑問がわいてきます.この質問をする前に過去ログを検索していたのですが,過去ログ299のコメントの中で,

>「一方の被検者群に試薬A,他方の被検者群に試薬Bを投与」というとき,臨床試験では,両方の標本を全く独立にとるのではなく,性,年齢などで「マッチング」するのが普通です。こうなると,「対応のある場合」と見なすことになります。

というご指摘があったと思います.
この場合,「マッチング」することで対応のあるデータとして見なすことができるのだと解釈したのですが,対応があるとする場合,当然両群のデータ数も同数にしなければなりません.
しかし,この場合の比較は,データ数が同数でなくても,また,対で並べ替えなくてもよいデータであるように思います.
ご指摘の例は,あえて両群のデータ数もマッチングさせて対応のあるデータと見なした方がよい(差が検出しやすくなる?)と解釈すればよいのでしょうか?
よろしくご教授下さい.

     [このページのトップへ]


430. Re^3: 対応のあるデータか独立のデータか?  青木繁伸  2003/05/21 (水) 23:10
> この場合,「マッチング」することで対応のあるデータとして見なすことができるのだと解釈したのですが,対応があるとする場合,当然両群のデータ数も同数にしなければなりません.

マッチングをするということだけで言えば,1:nマッチングというのはあります。
ただ,このようにした場合,対応のある平均値の差の検定というのは,どうなるのかな?

     [このページのトップへ]


436. Re^4: 対応のあるデータか独立のデータか?  悩める者  2003/05/22 (木) 19:30
> マッチングをするということだけで言えば,1:nマッチングというのはあります。
> ただ,このようにした場合,対応のある平均値の差の検定というのは,どうなるのかな?

例えば,1:3マッチングを行ったとして,1に対する3つのデータを平均して,1:1にするというのはダメですかねぇ...
平均値自体は,先に3つのデータの平均を対応数分足して対応数で割った値も,対応数×3個分のデータをすべて足しておいて実際のデータ数(対応数×3)で割っても同じになりますが.
でも,実際のデータ数を減らし,標本の分布を操作することになるので,分散などの統計値,検定を行うときの標本数や自由度に影響を与えることになり,やはり厳密にいえば上手いやり方ではないですよね.
すみません.蛇足でした.
どうも,ありがとうございました.

     [このページのトップへ]


429. Re^3: 対応のあるデータか独立のデータか?  青木繁伸  2003/05/21 (水) 23:08
> しかし,この場合の比較は,データ数が同数でなくても,また,対で並べ替えなくてもよいデータであるように思います.
> ご指摘の例は,あえて両群のデータ数もマッチングさせて対応のあるデータと見なした方がよい(差が検出しやすくなる?)と解釈すればよいのでしょうか?

その通りです。
マッチングというのは,可能な限り同じような対象のペアを作り,二つから対応のあるデータを取るということです。
同一個人から対応のあるデータを取るのが一番いいのだけど,例に挙げたような場合には,先に加えた処理の影響が後の処理に影響を与えると言うこともあるので,条件の似た別人をペアにするわけです。
実験計画としては,対応のあるデータを取る方が検出力が高いのです。
R で次の例を試してみると分かります。
x <- c(1,2,3,4,5,6,7,8,9,10)
y <- c(3,2,1,4,3,5,4,6,7,8)
t.test(x, y, pair=TRUE) # 対応のあるt検定
t.test(x, y, var=TRUE) # 二群の平均値の差のt検定(等分散性を仮定)

     [このページのトップへ]


435. Re^4: 対応のあるデータか独立のデータか?  悩める者  2003/05/22 (木) 19:00
> マッチングというのは,可能な限り同じような対象のペアを作り,二つから対応のあるデータを取るということです。
> 同一個人から対応のあるデータを取るのが一番いいのだけど,例に挙げたような場合には,先に加えた処理の影響が後の処理に影響を与えると言うこともあるので,条件の似た別人をペアにするわけです。
> 実験計画としては,対応のあるデータを取る方が検出力が高いのです。

ご丁寧なご回答,ありがとうございました.
よく分かりました.

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 024 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る