No.14088 分割表に対するノンパラメトリック検定  【シュリンプ】 2011/01/03(Mon) 18:16

よろしくお願いします。

ある調査をおこない,その結果を分割表にまとめました。その一例を簡略化して以下に示します。
    A1 A2 A3 A4 A5 A6 A7
形式1 2  12 14  3 1  2 0 
形式2 5  5 6  8 2  1 0
このような分割表を作ったとして,形式1と形式2に差があるといえるか,という検定をおこないたいと考えております。

私の少ない知識だと,ノンパラメトリック検定(Mann-WhitneyのU検定)を適用するのかと判断したのですが,それでよろしいでしょうか?

とても気になるのが,度数0の項目があることです。
SPSSを用いて,ノンパラメトリック検定(Mann-WhitneyのU検定)をおこなうと,

> Warning # 3211
> 少なくとも 1 つのケースにおいて,重みづけ変数の値が 0 か負の値か,あるいは
> 値自体がありません。統計手続きにおいては,重みづけ変数の値は正でなけれ
> ばならず,よってこれらのケースは欠損値として取り扱われます。LIST や SAVE
> のような非統計手続きの場合は,これらの値はそのままになります。

という表記が出力されます。
これは気にしなくて良いでしょうか?

気にすべき(問題がある)ということであるならば,どうすべきなのでしょうか?

あまりにもど素人で,とんでもなく的外れなことをしてしまっているかもしれません。
ご教授いただければ幸いです。
よろしくお願いします。

No.14093 Re: 分割表に対するノンパラメトリック検定  【青木繁伸】 2011/01/03(Mon) 20:41

SPSS はよくわからないというか,あなたがどう言うようにこのデータを分析したのかよくわからないのでどうとも言えませんが,カテゴリー 7 は結局どちらの群でも該当がなかったのだから,第 7 カテゴリーを分割表に含めたからおかしな事が起きたんでしょう。まずはそれを省いて実行すべし。

そもそも,元データを対象に検定したら,こんな問題は生じないでしょう。
> x <- c(rep(1:6, c(2, 12, 14, 3, 1, 2)),
+ rep(1:6, c(5, 5, 6, 8, 2, 1)))
> g <- factor(rep(1:2, c(34, 27)))
> wilcox.test(x ~ g)

Wilcoxon rank sum test with continuity correction

data: x by g
W = 415, p-value = 0.5138
alternative hypothesis: true location shift is not equal to 0

警告メッセージ:
In wilcox.test.default(x = c(1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, :
タイがあるため,正確な p 値を計算することができません
> wilcox.test(x ~ g, correct=FALSE)

Wilcoxon rank sum test

data: x by g
W = 415, p-value = 0.509
alternative hypothesis: true location shift is not equal to 0

警告メッセージ:
In wilcox.test.default(x = c(1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, :
タイがあるため,正確な p 値を計算することができません

> library(exactRankTests) # ★★★★★ これが一番お勧めでしょう
> wilcox_test(x~g, distribution="exact")

Exact Wilcoxon Mann-Whitney Rank Sum Test

data: x by g (1, 2)
Z = -0.6605, p-value = 0.5121
alternative hypothesis: true mu is not equal to 0

以下の実行例は http://aoki2.si.gunma-u.ac.jp/exact/utest/getpar.html にて


No.14095 Re: 分割表に対するノンパラメトリック検定  【シュリンプ】 2011/01/04(Tue) 01:42

青木先生,早速のご返信ありがとうございました。よく理解できましたが,以下の疑問が生じましたので,大変恐縮ですが,再度ご教授頂ければ幸いです。
    A1 A2 A3 A4 A5 A6 A7
形式1 0  4 9 8 10  1 1 
形式2 1 6 9 4 3 4 1
というように,(先ほどの質問の例は,カテゴリー7がともに「0」だったので,省いて実行すべき,ということは理解できたのですが,)一方のみ,度数が「0」の場合は,どのように扱うべきなのでしょうか?

なにとぞ,よろしくお願いします。

No.14097 Re: 分割表に対するノンパラメトリック検定  【青木繁伸】 2011/01/04(Tue) 08:51

一方だけに度数0があるのは,何の問題もないでしょう。

いずれにせよ,元データで検定すれば,何の問題もないことです。

No.14098 Re: 分割表に対するノンパラメトリック検定  【シュリンプ】 2011/01/04(Tue) 09:21

青木先生,明快なご回答を頂きまして,ありがとうございました。

No.14100 Re: 分割表に対するノンパラメトリック検定  【ひの】 2011/01/04(Tue) 16:17

>私の少ない知識だと,ノンパラメトリック検定(Mann-WhitneyのU検定)を適用するのかと判断したのですが,それでよろしいでしょうか?

  A1からA7という項目が順序尺度以上の水準のデータならそれでよいと思いますが,名義尺度以下のデータ水準ならU検定は不適当で,Fisherの正確確 率検定かカイ二乗検定をすべきです。A1からA7の尺度水準はお書きになった情報からは判断できませんのでU検定が適当かどうかは分かりません。

No.14101 Re: 分割表に対するノンパラメトリック検定  【シュリンプ】 2011/01/04(Tue) 16:26

ひのさま,コメントありがとうございました。

確かに,データ水準に関する情報が抜けており,それによって,適用可否は分かれますよね。

例としてあげた表中のデータは,順序尺度のデータですので,U検定を適用しようと考えました。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る