No.10604 等分散性と正規性を仮定しない場合の2変数間の関係評価について  【Genetist】 2009/08/07(Fri) 00:32

(1)いつも先生のウエブを参考にさせて頂いております。

(2)集団遺伝学関係のメタ解析でペーパーを書いており,「集団間の地理的距離(これが独立変数Xです)が大きいほど,集団間の遺伝的な違い(これが従属変数Yです)も大きくなること」という仮説を立て,数十の先行研究データを基に,検証しようとしています。

(3)X を横軸に,Yを縦軸にプロットの分布図を描くと,確かにXが大きくなるほどYも大きくなりますが,それと同時にYのばらつきも大きくなりました。このた め,「等分散性と正規性が成り立っていないので,一般的な回帰分析とPeasonの相関係数による評価は不適なのでは?」と指摘されたのですが,どの様な 代替策があるでしょうか。正規性については角変換で対処するのも可能かもしれませんが,等分散性の問題についてはよく分からず困っております。

(4) また,同様の解析している論文の中には,回帰分析ではなく,地理的距離Xをいくつかの段階(例えば0〜10km,10〜100km,100〜1000km 等)に分けて,各段階ごとにYの値をグルーピングして,ANOVAや多重比較している例がありますが,この様な群間比較を行うのと,上述の回帰分析とでは どちらの方が適切なのでしょうか。

(5)なお,(4)で書いた群間比較を私の等分散性と正規性の成り立っていない(可能性がある)データ で行おうとする場合は,どのような検定が使えるのでしょうか。正規性を仮定しない場合はクラスカル・ウォーリス検定があり,また等分散性を仮定しない2群 間検定ならウェルチの検定があると認識していますが,両性質を仮定しない3群間以上の検定は存在するのでしょうか。

ペーパーを投稿するにあたり非常に切実な問題として直面しており,是非ご助言を頂ければ幸甚です。宜しくお願い致します。

No.10607 Re: 等分散性と正規性を仮定しない場合の2変数間の関係評価について  【青木繁伸】 2009/08/07(Fri) 08:35

> (4)また,同様の解析している論文の中には,回帰分析ではなく,地理的距離Xをいくつかの段階(例えば0〜10km,10〜100km,100〜 1000km等)に分けて,各段階ごとにYの値をグルーピングして,ANOVAや多重比較している例がありますが,この様な群間比較を行うのと,上述の回 帰分析とではどちらの方が適切なのでしょうか。

グループ化すると情報が失われるということは,欠点ですね。

> (5)略。。また等分散性を仮定しない2群間検定ならウェルチの検定があると認識していますが,両性質を仮定しない3群間以上の検定は存在するのでしょうか。

3群以上の場合でも,Welch の方法があります(アルゴリズムは R の oneway.test のソースを参照。または,http://aoki2.si.gunma-u.ac.jp/R/my-oneway-ANOVA.html

No.10613 Re: 等分散性と正規性を仮定しない場合の2変数間の関係評価について  【Genetist】 2009/08/08(Sat) 02:24

青木先生,迅速なご回答をありがとうございます。

(4)についてはやはりグルーピングして群間比較するより回帰分析の方が良さそうと感じました。

(3)に関してですが「等分散性が成立しない場合の回帰分析」方法として,加重最小2乗法や変数変換(例:対数変換)があるという話を聞いているのですが,両者の方法ではどちらがどういう場合に適しているといった違いはあるのでしょうか。ご教示頂ければ幸甚です。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る