★ 相関係数が高ければ類似性を主張できるのですか? ★

3994. 相関係数が高ければ類似性を主張できるのですか? ミコト 2004/08/20 (金) 16:00
├3999. Re: 相関係数が高ければ類似性を主張できるのですか? 青木繁伸 2004/08/21 (土) 23:08
│└4012. Re^2: 相関係数が高ければ類似性を主張できるのですか? ミコト 2004/08/23 (月) 10:38
│ ├4016. Re^3: 相関係数が高ければ類似性を主張できるのですか? ktr 2004/08/23 (月) 17:20
│ │└4044. Re^4: 相関係数が高ければ類似性を主張できるのですか? ミコト 2004/08/25 (水) 10:13
│ └4013. Re^3: 相関係数が高ければ類似性を主張できるのですか? 青木繁伸 2004/08/23 (月) 10:52
└3998. Re: 相関係数が高ければ類似性を主張できるのですか? ktr 2004/08/21 (土) 22:52


3994. 相関係数が高ければ類似性を主張できるのですか? ミコト  2004/08/20 (金) 16:00
はじめまして。必要に迫られて統計学的解析を行わなければならなくなりましたが,ちょっと悩んでいます。いま,いくつかのデサン プルデータが「似ている」のかいないのかを検定したいのですが,その際に相関分析法を使用して良いのかどうかをお聞きしたいのです。現データは独立の事象 で共通の原因により変化しますが,片方が変化したらもう片方に影響するようなデータではありません。たとえば,2冊の本があるとして,この2冊は同じ本か 違う本かわからないとして,1から100ページまでの文字数を順番にデータとしたとします。この両者で相関解析を行うともし同じ本ならr=1になりますよ ね。これを両者が同じ本の可能性が高いことを主張する根拠にするような使用方法は容認されますか?どなたかコメントいただけたらうれしいです。

     [このページのトップへ]


3999. Re: 相関係数が高ければ類似性を主張できるのですか? 青木繁伸  2004/08/21 (土) 23:08
類似性といってもいろいろ定義がありますからね。

それと,相関係数が1ということであっても,たとえば
X: 1, 2, 3, 4, 5
Y: 10, 20, 30, 40, 50
だって,相関係数は1ですよ。
Z: 1.2, 2.1, 3.1, 4.2, 4.9
のとき,X は Y と似てるの?それとも Z と似てるの?

# たとえ話が成功しない例は,過去無数にありました。

     [このページのトップへ]


4012. Re^2: 相関係数が高ければ類似性を主張できるのですか? ミコト  2004/08/23 (月) 10:38
青木先生,ktr先生,コメント有り難うございました。週末ネットが見られなかったためにお礼が遅れて申し訳ありません。そうで すよね,全く例えが悪いとは思ったのですが,うまく説明できなくてすみません。具体的にお話します。現在ゲノム関係の研究をしています。DNA中に存在す る特殊な物質(仮にXとします)の存在場所(ゲノム位置)とその位置におけるXの検出量を解析しました。ゲノム位置に1-3000までの通し番号をつけ, 対応する位置におけるX量を連続変数データとしました。同様の解析を4個体(A-D)で行った結果,Xが検出されるゲノム位置と検出量には共通性がありそ うだということになりました。そして単純にこの個体別データをノンパラメトリック用の相関分析(Spearman rank correlation test)を行ってみると,A-Dのどの組み合わせでもr=0.8以上,P<0.0001となります。この結果をうけて,「だから,Xの検出結果に おいて個体間で共通性がある」と主張することが許容されるのか否かについてコメントをいただきたかったのです。要するに個体間ではXについて因果関係があ るわけではなく,Xの解析に於いて同様の検出傾向(同位置で検出量が同じように高いあるいは低いか?)があるか否かを検定したいのですが,相関分析が使用 できるのでしょうか。よろしくお願いします。

     [このページのトップへ]


4016. Re^3: 相関係数が高ければ類似性を主張できるのですか? ktr  2004/08/23 (月) 17:20
 相関分析だと何を比較しているのかあいまいになりませんか?
物質xのゲノム上の検出位置がすべて同じ位置なら,検出量に100倍の量が検出された場合でも,相関分析ならr=1ですよね(青木先生のおっしゃるとおりです)。
 4つの個体で検出・非検出が共通している位置が全体の何パーセントか,という基準では不十分?

  2個体でともに検出された位置に限れば,相関分析にも意味があるかもしれない。個体A内で,他の位置と比べて高い検出量が見られる位置は,個体B内でも検 出量が相対的に高い,という仮説は検証可能かもしれない。しかし,その場合でも傾向のみで,量の類似度は判定できない(結局,なにをもって類似とするのか という問題に帰ってきてしまいますね)。

     [このページのトップへ]


4044. Re^4: 相関係数が高ければ類似性を主張できるのですか? ミコト  2004/08/25 (水) 10:13
ktr先生,青木先生,コメント有り難うございました。私なりに考えて,対応策を検討しました。まず,「類似性」を検出場所の共 通性(%表示とした,ktr先生の御指摘のように)と検出頻度に分けて考えることにしました。後者については個体別データの分散分析値を示し,クラスカ ルーウォリス検定で各郡間に差がないことを示し(実際に棄却値には落ちませんでした)た後,相関分析を行うことにしました。さらに,同一の領域で同じよう に高い,低いの傾向があるかを示すために回帰分析を行いました(どの組み合わせでもR2=0.5以上,p>0.0001でした)。これでなんとか矛盾はな さそうな気がするのですが,いかがでしょうか?あるいはこの目的のためには別の方法でデータ表示すべきで,相関,回帰分析は必要無いのかもしれません。

     [このページのトップへ]


4013. Re^3: 相関係数が高ければ類似性を主張できるのですか? 青木繁伸  2004/08/23 (月) 10:52
だから,類似性をどのように定義するかによるわけでしょう。

     [このページのトップへ]


3998. Re: 相関係数が高ければ類似性を主張できるのですか? ktr  2004/08/21 (土) 22:52
たとえが悪い気がします。直面している問題を具体的に提示されてはいかがでしょうか。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 030 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る