No.10491 対応の有無で結果が変わる場合は?  【統計初心者A】 2009/07/28(Tue) 09:17

本当に基本的なことで教えてください。
実験である処理を行った前後で,効果が有意にでたかどうかを判定する場合に

?対応のない場合では有意差がなく,
?対応がある場合で検定すると有意差がでるとき

どのように考えたら良いのでしょうか?本当にこの処理で有意に変化すると考えてよろしいのでしょうか?
論文でも見かけるのですが,対応なしの生データでは有意差ないのに,
対応つけて差をだしたり,増減の割合をもって有意差をつけていることがあります。
これは正しいのでしょうか?
よろしくお願いします。

No.10492 Re: 対応の有無で結果が変わる場合は?  【青木繁伸】 2009/07/28(Tue) 09:55

対応のあるデータは対応のあるデータとして扱い,対応のないデータは対応のないデータとして扱うだけのことです。

> 対応なしの生データでは有意差ないのに,対応つけて差をだしたり,増減の割合をもって有意差をつけていることがあります。

もってのほかです。
学会誌にそのようなものがあったのですか?そのような論文をパスさせてしまう査読者は欠陥差読者ですね。編集委員会も編集委員会です。

No.10493 Re: 対応の有無で結果が変わる場合は?  【統計初心者A】 2009/07/28(Tue) 10:10

早速の回答ありがとうございました。
対応つける場合とつけない場合で別個に扱うことは,数学的には理解しておりますが,

たとえば,薬などの効果にあてはめてみると
対応をつけないとは,無差別に大きくみたときに効果がないと判定されるが,
対応をつけてみるとわずかな差ではあるが有意に効果があると判定される
という意味になりますよね。
この場合について,薬が効きますよと自信もって言えるのでしょうか?

お伝えしにくいのですが,何か自分の腑に落ちないのです。

No.10494 Re: 対応の有無で結果が変わる場合は?  【青木繁伸】 2009/07/28(Tue) 10:19

> たとえば,薬などの効果にあてはめてみると
> 対応をつけないとは,無差別に大きくみたときに効果がないと判定されるが,
> 対応をつけてみるとわずかな差ではあるが有意に効果があると判定される
> という意味になりますよね。

「無差別に大きくみたときに」って,どういうことでしょうか。

> 対応つける場合とつけない場合で別個に扱うことは,数学的には理解しておりますが,

数学的にではなく,統計学的にです。とにかく,対応のあるデータなら,対応のある検定をやって,P値が有意水準より小さければ有意とする。それ以外のことを迷う必要はないのです。対応のない検定の代替案(?)として対応のある検定をやってみるなんて無意味です。

No.10495 Re: 対応の有無で結果が変わる場合は?  【統計初心者A】 2009/07/28(Tue) 10:34

言葉が正確でなくて申し訳ありません。
無意味なんですね,対応をつけるべきかどうかを判断してデータを扱うことが大事ということですね。
なんだか,文献をみているとその辺のトリックがあるのではと疑ってしまうことがありまして・・・
ご丁寧に,ご教授ありがとうございました。

No.10496 Re: 対応の有無で結果が変わる場合は?  【青木繁伸】 2009/07/28(Tue) 10:49

言葉尻をとらえるようですが,「対応をつけるべきかどうか」ではなく,対応が付いているかどうかは実験デザインで決まってしまっているのです。データを採ってから,対応をつける(任意あるいは恣意的な組合せを作る?)のではないのです。

No.10497 Re: 対応の有無で結果が変わる場合は?  【TWF】 2009/07/28(Tue) 10:59

対応の有無は,簡単そうで案外難しい概念ですね。分かり易いかどうか分かりませんが,優しく解説した”ハンバーガーショップで学ぶ楽しい統計学”http://kogolab.jp/elearn/hamburger/index.htmlが参考になるかも知れません。

No.10499 Re: 対応の有無で結果が変わる場合は?  【統計初心者A】 2009/07/28(Tue) 11:16

度々すみません。

個々人の身長,体重,血圧などは明らかに対応がありますが,
今使用している対象は人ではなく,個々サンプルの差が明確にあるかがわからないようなものなのです。そうした状況でしたので,「対応をつけるべき」という言葉になりました。

No.10500 Re: 対応の有無で結果が変わる場合は?  【青木繁伸】 2009/07/28(Tue) 11:27

> 個々サンプルの差が明確にあるかがわからないようなものなのです

どのようなものなのでしょうか?
対応があるかないかがわかにくいものだと言うことですか?

No.10501 Re: 対応の有無で結果が変わる場合は?  【統計初心者A】 2009/07/28(Tue) 11:42

たとえば,抜歯したヒトの歯です。
歯質には違いがあるという先生もいまして,対応をつけて調べている論文もあり,
ほとんど無機質で個人差を無視,一緒くたに対応なしで研究している先生もいます。

たぶん,他にもそういうケースがあるのでは。

No.10502 Re: 対応の有無で結果が変わる場合は?  【青木繁伸】 2009/07/28(Tue) 12:40

同じ人の複数の条件下の抜歯した歯ですか。測定対象だけを特定されても,複数の条件下とはどのようなものか,抜歯した歯の何を測定(観察)しているのかがわからないとねえ。
私 は歯は素人ですが,例えば,歯の再石灰化を促すというある処理をする前と後でそれぞれ抜歯された歯の再石灰化の程度を比較する,なんて場合には,対応のあ るデータでしょう。あなたも書いたように人によって歯の質が違うと言うこともあるでしょうが,そのほかにも歯磨きの状態とか食生活とか処理の前後で変わら ない個人に特有の条件というものがあるでしょうから。
「一緒くたに対応なしで研究」というのもひどいですね。歯のような場合,さらにやっかいなの は,同一人からの歯が複数本あるような場合です。ある人は1つの条件下の1本だけ,別の人は1つの条件下で2本,別の条件下で3本なんて,何が観察単位か わからないようなデータを平気で分析するのもどうかと思いますね。ちゃんと実験計画(観察計画)を立ててやらないと,知らず知らずのうちに,バイアスのあ る結果を得ることになってしまうことでしょう。

No.10506 Re: 対応の有無で結果が変わる場合は?  【にゃんちゅう】 2009/07/28(Tue) 18:36

なんとなくこの議論について疑問を感じます。

対応のある場合と対応のない場合の処理で結果が違う ということは2つのデータの間に正の相関があるということですね。相関がない場合は両者の結果は同じになるでしょう。そうすると,正の相関の程度が大きい ので有意になったのなら,対応に意味がある可能性が高いですね。相関が小さくても対応のある場合に有意になったのならそれは,もともとぎりぎりで棄却され たのではないですか。サンプルサイズは十分だったのでしょうか?

という風に議論をすすめる可能性もあるように思えます。

No.10508 Re: 対応の有無で結果が変わる場合は?  【青木繁伸】 2009/07/28(Tue) 20:58

> 相関がない場合は両者の結果は同じになるでしょう

そうですか?

以下のような場合,同じになりませんでした。間違えているかなあ。
> library(MASS)
> d <- mvrnorm(n=20, mu=c(0, 0), Sigma=matrix(c(1,0,0,1), 2), empirical = TRUE)
> # 母分布が正規分布である x
> (x <- d[,1])
[1] -0.56377999 1.64436440 -0.47735729 0.66084458
[5] -0.21252588 -0.63652918 -1.07406005 -0.20006807
[9] 1.50396811 -1.45756114 -0.04821941 0.57961378
[13] 1.52454789 -0.53278458 -1.56101291 -0.67842031
[17] 1.59541099 -0.79254492 0.32580035 0.40031362
> cat(sprintf("x: mean = %f, sd = %f\n", mean(x), sd(x)))
x: mean = 0.000000, sd = 1.000000
> # 母分布が正規分布である y
> (y <- d[,2]*0.9+0.62)
[1] 1.2297597 0.4577796 0.7759699 0.4102774 0.7864049
[6] 0.7163363 -0.8257876 1.2359575 1.4074405 1.8528642
[11] -0.9598174 -0.9908080 0.4643389 -0.2372249 1.1729638
[16] 1.4405758 1.1464966 -0.3282716 0.5207805 2.1239641
> cat(sprintf("y: mean = %f, sd = %f\n", mean(y), sd(y)))
y: mean = 0.620000, sd = 0.900000
> cat(sprintf("相関係数 r = %f\n", cor(x, y)))
相関係数 r = -0.000000
> # 等分散を仮定したときの対応のない t 検定の P 値
> t.test(x, y, var.equal=TRUE)$p.value
[1] 0.04619976
> # 等分散を仮定ないときの対応のない t 検定の P 値
> t.test(x, y, var.equal=FALSE)$p.value
[1] 0.04627675
> # 対応のある t 検定の P 値
> t.test(x, y, paired=TRUE)$p.value
[1] 0.05326457

No.10509 Re: 対応の有無で結果が変わる場合は?  【takahashi】 2009/07/28(Tue) 21:12

なんか勘違いしてるかもしれませんが,そもそも対応のない2変量間の相関って考えることできますか?
相関係数を計算できるなら,対応あるような気がしますが・・・
そんなことないのかなぁ。

No.10511 Re: 対応の有無で結果が変わる場合は?  【青木繁伸】 2009/07/28(Tue) 21:29

対応のあるデータにおいて,t値を計算するのに,二条件下のデータの差を使う方法と,相関係数を使う方法とがあるので,後者の場合には元のデータがなくても(差のデータがなくても)統計量を計算できるのです(確かそうだった。普通使わないので覚えていない)。
で すから,まあ,対応のないデータがあっても,無理矢理相関係数を計算して,対応のない場合のt検定統計量を計算することはできるということ(相関係数を計 算しなくても,適当な対応を仮定して,対応のあるt検定統計量を計算することは可能です。しかし,そのような仮定自体無意味ということでしょう)。
まあ,相関係数を利用する検定統計量の計算法を再確認しないとね。。

No.10512 Re: 対応の有無で結果が変わる場合は?  【青木繁伸】 2009/07/28(Tue) 21:36

まあ,近頃,すっかり物忘れが激しくて,R の関数を書いたのを忘れていた。ググって自分のページが出てきた。

http://aoki2.si.gunma-u.ac.jp/R/paired-t-test.html

No.10543 Re: 対応の有無で結果が変わる場合は?  【にゃんちゅう】 2009/07/31(Fri) 15:31

自由度の違いを考慮してませんでした。自由度がもともと大きい場合はたいした違いにはなりませんが,自由度が小さい場合はかなり違ってきます。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る