No.05612 ブートストラップ法による多群間の平均値の比較  【まっす】 2008/01/30(Wed) 22:14

初めて質問させていただきます。

多群間の平均値の比較を,ブートストラップ法を用いた2群間の平均値の差の検定を繰り返すことで求めています。

流れとしてはWelchのt検定を拡張した一元配置分散分析法でF値を算出し,「多群間の平均の等性」という帰無仮説を棄却したあと,「平均に差がある群」を探すため多重比較法を実施しました。
有意水準はホルムの方法によって調整をしました。

多群のサンプル数はそれぞれ1500以上と十分とっているのですが,ヒストグラムで確認すると外れ値が多いようで尖度や歪度も高かったので,まずは標準的なstudentのt検定を行った後,ブートストラップ法を用いて平均の比較を行いました。

その際,ブートストラップp値が0.5以上になる群の組み合わせが複数あります。
観測値を対象に行ったstudentのt検定ではt値がマイナスになっています。
そのp値は1-pとして検証する方法でよろしいのでしょうか。

前置きが長くなって申し訳ありません。
よろしくお願いいたします。

No.05613 Re: ブートストラップ法による多群間の平均値の比較  【青木繁伸】 2008/01/30(Wed) 22:31

なぜ,ブートストラップ法などをやらないといけないのか必然性が私にはよく分かりませんが

> 観測値を対象に行ったstudentのt検定ではt値がマイナスになっています。
> そのp値は1-pとして検証する方法でよろしいのでしょうか。

両側検定ならば,t値がマイナスになるというのは,t統計量の計算の分子が(平均値1-平均値2)になっているからでしょう。
両側検定ならば abs(平均値1-平均値2)にするだけですよ。
片側検定ならば,引き算の方向は前もって決まっているわけですから,検定統計量が正になったから・負になったからといって,あたふたとその後の対応を変えるものではないでしょう。
変ですよ。ね。

No.05614 Re: ブートストラップ法による多群間の平均値の比較  【まっす】 2008/01/30(Wed) 22:50

早速のコメント,ありがとうございます。

> t検定に限らず,両側検定・片側検定にかかわらず,「p値は1-pとして検証する」なんてことはありません。(聞いたことも読んだこともないでしょう?)

はい,確かに聞いたこともありませんでした。
ただブートストラップ法の平均の差の検定を扱っている某シリーズ本の記述のままに実装してしまったので,そういう結果になるものなのかと自分で勝手に納得し,t統計量の分子をabs(平均値1-平均値2)にしておりませんでした。
私の理解力不足が招いてしまったようです。

続けてもう一つ質問させていただいてもよろしいでしょうか。

> なぜ,ブートストラップ法などをやらないといけないのか必然性が私にはよく分かりませんが

は い,正直な話自分でも疑問に思っているのですが,ただ2群間の平均の差の検定を行う際,t検定は両群に正規分布を仮定しているわけですが(この認識からし て間違っているのでしょうか?),今回のケースではそれぞれの群の尖度や歪度が高かったものですから,外れ値の影響も考慮できるかと思い,ブートストラッ プ法を用いました。
この考え方は間違っているのでしょうか?

No.05615 Re: ブートストラップ法による多群間の平均値の比較  【青木繁伸】 2008/01/30(Wed) 23:07

> それぞれの群の尖度や歪度が高かったものですから,外れ値の影響も考慮できるかと思い,ブートストラップ法を用いました

ブートストラップ法で個々の検定は何を使ったのですか。
個々の検定でt検定を使ったのなら,何の意味もないでしょう?
ブートストラップ法は,検定統計量の分布が定義できないとかはっきりしないときに使われるのでは?

データが正規分布に従わないからというだけの理由ならノンパラメトリック検定を採用するとか?の選択肢を取る方が良いのではないでしょうか。

No.05616 Re: ブートストラップ法による多群間の平均値の比較  【まっす】 2008/01/30(Wed) 23:25

> ブートストラップ法で個々の検定は何を使ったのですか。
> 個々の検定でt検定を使ったのなら,何の意味もないでしょう?

はい,たしかに検定はt検定を使っています。
それではいけないのでしょうか?
私はブートストラップ法自体が,分布を仮定できない状況において検定方法を実現可能にする,いわば仲介役のようなものなのかなと考えていました。

> データが正規分布に従わないからというだけの理由ならノンパラメトリック検定を採用するとか?の選択肢を取る方が良いのではないでしょうか。

そのノンパラメトリック検定としてブートストラップ法を教えていただきました。
他のノンパラメトリック検定手法も参考にしてみます。


申し訳ありません,続けて質問させていただきます。

abs(平均値1-平均値2)のabsは,観測値に基づく検定統計量の実現値とブートストラップ検定統計量の値の両方にかけるべきなのでしょうか?

No.05617 Re: ブートストラップ法による多群間の平均値の比較  【青木繁伸】 2008/01/30(Wed) 23:37

ウェルチの方法と普通の方法どちらを取ったのか分かりませんが,いずれにせよ
http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html
にある t0 の計算式において,分子に abs を適用していると言うことです。

要約すると,

> Welchのt検定を拡張した一元配置分散分析法でF値を算出し,

たのですから,この時点でもはや,

> ぞれの群の尖度や歪度

に問題があるのですから,その後の検定(多重比較)で尖度や歪度の問題を考慮して検定を進めるというのに矛盾があるのです。

t検定(一元配置分散分析)の頑健性(正規分布から少々はずれていても,等分散でなくても検定結果に大きな問題は生じない)ということもありますからね。

それが不安ならば,全体の検定も,個々の2群の組み合わせの検定もノンパラメトリック検定で(ブートストラップなどは不要)行えばよいだけだと思います。

No.05618 Re: ブートストラップ法による多群間の平均値の比較  【まっす】 2008/01/30(Wed) 23:45

> 要約すると,
>
>> Welchのt検定を拡張した一元配置分散分析法でF値を算出し,
>
> たのですから,この時点でもはや,
>
>> ぞれの群の尖度や歪度
>
> に問題があるのですから,その後の検定(多重比較)で尖度や歪度の問題を考慮して検定を進めるというのに矛盾があるのです。

> それが不安ならば,全体の検定も,個々の2群の組み合わせの検定もノンパラメトリック検定で(ブートストラップなどは不要)行えばよいだけだと思います。

確かによく考えればその通りですね。
ブートストラップ法を何となく使ってみたかったという心理が大きかったようです。
質問にご回答くださり,ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る