No.01771 Re: 分散分析について 【青木繁伸】 2006/12/05(Tue) 19:29
1) 特に間違いはないでしょうが,正規分布するかしないかは標本を見ての話ではないということに注意しましょう。正規検定してから次の検定と言うことだと,検 定の多重性が問題になりますよ。多重比較する前に一元配置分散分析は必要かと言うときに一元配置分散分析をしてからというのは検定の多重性の点で問題にな ると指摘する立場に似ているでしょうね。
2) 1)とも関連しますので,話の方向は決まっている。どこかにも書いたが,制約の緩いノンパラメトリックで有意になったら制約を満たしているパラメトリックでも有意になるんだから,ノンパラメトリックでいいじゃないの,というのも,一つの割り切り方。
変数によって検定法を変えるのも,紋切り型かなという気もしないでもない。
3) クラスカル・ウォリス検定だけが全てではないし,SPSSだけが全てではない。SPSSでできないなら,できるものを捜す。(SPSSのマクロで検定プログラムを書いても良いのだろうけど)
http://aoki2.si.gunma-u.ac.jp/lecture/Average/kwtest.html
の後半に多重比較の方法について説明している。また,Rの関数を
http://aoki2.si.gunma-u.ac.jp/R/kruskal-wallis.html
に紹介している。
R で書いた,他の多重比較については,
http://aoki2.si.gunma-u.ac.jp/R/index.html
の XII 多重比較のところに紹介している。
No.01773 2標本の比例・間隔尺度におけるノンパラ・パラの選択手順について 【白方】 2006/12/05(Tue) 22:00
早速ご教示ありがとうございます。3)については早速,先生のサイトを活用させていただきます。
根本的なことが理解できていないと思うのですが,恥を忍んでお聞きします。
「正規分布するかしないかは標本を見ての話ではないということに注意しましょう。正規検定してから次の検定と言うことだと,検定の多重性が問題になりますよ。」
と のことですが,たとえば対応のない2標本での比例・間隔尺度の代表値の差の検定においてパラ・ノンパラの選択はどういう条件や手順を踏んでで選択したらよ いのでしょうか?今までは両群のデータをヒストグラムで視覚的に確認後,Kolmogorov-Smirnov検定で両群とも正規性を認めればt検定,い ずれか1群でも正規性を認めなければマン・ホイットニー検定を行っていたのですが…
理解が悪く,度々お手数をおかけしますが,2標本の比例・間隔尺度におけるノンパラ・パラの選択手順に焦点を当て,ご教示をお願いいたします。
No.01774 Re: 分散分析について 【青木繁伸】 2006/12/05(Tue) 22:57
検定は,検定対象の大きさ(平均値の差とか相関係数の大きさなど)と同時に,サンプルサイズにも影響を受けます。
正 規性の検定も同じことで,サンプルサイズが小さいと正規性の帰無仮説は採択されやすくなることに注意。つまり,サンプルサイズが小さいと見た目で正規分布 からはずれていても,「正規分布ではないとは言えない」ことになり,「ではパラメトリック検定を使いましょう」ということになるでしょう?(それは,極端 ですけどね)逆に,サンプルサイズが大きいと,ほんのちょっとでも正規分布からはずれていれば,正規性仮説は棄却され,「ノンパラ検定しか使えませんよ」 ということになってしまいます。
等分散性の検定も同じような性質を持っていますね。杓子定規に標本の状態を前もって検定してから検定方針を決めるというのは,このようなジレンマを持っています。
さて,ではどうしたらよいか。
基本的には,「そもそも母集団はどのような分布に従うのだろうか」という問いかけをするべきでしょう。実際には母集団がどのような分布に従うのかは分からない(知ることができない)ことが多いでしょう。それまでの知見を総合して,判断を下す必要があるでしょうね。
もっともよく行われているのは,余りよく考えずにパラメトリック検定を行う。そして,それは多くの場合,明らかな間違いにはならない。
勧められるのは,何回も書いたが,制約を満たさなそうな(いい加減な判断かもしれないが)データの場合には,制約のない(少ない)ノンパラメトリック検定を行う。有意になったらそれでよし。有意にならなくっても,それはそれでいいじゃないですか。
た とえばt検定とマン・ホイットニーの U 検定を比べたとき,マン・ホイットニーの U 検定の検定効率は3/π≒0.9549297です。その意味は,条件を満たしたときにt検定を採用したとすれば,マン・ホイットニーの U 検定でそれと同じ検出力を得ようとすると,t検定で使ったサンプルサイズのπ/3倍≒1.047198の標本が必要ということです。約5%増しです。これ はほとんど?無視できる範囲でしょう。
No.01775 Re: 分散分析について 【白方】 2006/12/05(Tue) 23:16
初歩的で安易な質問に,大変わかりやすくご説明頂ありがとうございました。
よく理解できました。(理解できたつもりかもしれませんが)
「制約を満たさなそうな(いい加減な判断かもしれないが)データ」であるかどうかを分散分析や正規分析以外でどのように判断すればよいのでしょうか?
No.01776 Re: 分散分析について 【青木繁伸】 2006/12/05(Tue) 23:30
その分野における知見と自分の経験から,ですかね(^_^;)
No.01777 Re: 分散分析について 【白方】 2006/12/05(Tue) 23:42
貴重な時間を裂き,ご教示いただきありがとうございました。何せ,臨床経験が
年数,質とも乏しいもので…
私のような統計を基礎から学ばすトップダウン的に学習している者にとって非常に
助かります。今後とも教示の方よろしくお願いいたします。
● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る