★ 不等分散を伴う3群以上の平均値の比較 ★

9978. 不等分散を伴う3群以上の平均値の比較 小石川 2006/05/10 (水) 23:55


9978. 不等分散を伴う3群以上の平均値の比較 小石川  2006/05/10 (水) 23:55
はじめて質問をさせていただきます。理系の院生です。
誤解を招かないように書いたら質問の文が堅苦しくなりましたが,
お許しください:

互いに標本分散が大きく異なる3群のデータがあるとします。
データの正規性は保証されているとします。
等分散性の検定で,母分散が群間で等しいという帰無仮説が棄却されました。
母平均が3群間で等しいかどうかを検定したいときに,従来ならば
対数変換などを施して,データの不等分散を解消してから分散分析をします。

しかしながら,対数変換などをしてもデータの不等分散が解消されないことは
よくあります。そこで次のような方法で母平均の群間比較の検定をしようと
考えました。

データはそれぞれ独立した3個の正規分布からのランダムサンプリングの
結果だと考えます。そして,以下のふたつのモデルを考えます。

Model 1: 母分散は群間で異なった値を取り得るが,母平均は3群で同じ値を取る。
尤度関数は象徴的に g = N(m,v1) + N(m,v2) + N(m,v3) と書けます。
パラメータ数は4個です。

Model 2: 母分散も母平均も3群でそれぞれ異なった値を取り得る
尤度関数は象徴的に g = N(m1,v1) + N(m2,v2) + N(m3,v3) と書けます。
パラメータ数は6個です。

ただし,N(m,v)は平均が m で分散が v のパラメータを持つ正規分布を意味します。
また,たとえば N(m,v) = exp(-(y-m)^2 / 2v) / √2πv となります。
v と m がパラメータで,y が観測値(生データ)です。
g の式ではデータの群を区別するダミー変数を省略しています。

このふたつのモデルについて,それぞれ最大尤度を計算して,
尤度比検定を行います(自由度は6−4=2)。
もし p < 0.05 ならば,3群の母平均は統計的に異なると結論づけます。

要するに,不等分散のデータの母平均を分散分析で検定するのをあきらめて,
モデルのあてはめと尤度比検定で対処するというはなしです。

このような方法で母平均を比較した例を論文や統計学の教科書で見たことが
ないのですが,それがなぜなのかを知りたいと思っています。

たとえば,数学的に問題があったり,論理的欠点があるのでしょうか。
それとも単に分散分析の使用が習慣的に普及しているため,他の方法が
使われないのでしょうか。

ひとりで考えていても結論がでません。なにかご意見を伺えれば助かります。


● 「統計学関連なんでもあり」の過去ログ--- 037 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る