No.07554 検定について  【CEO】 2008/09/02(Tue) 15:03

はじめて投稿します。よろしくお願いします。
統計はまったくの素人で,四十の手習いで本を買って頑張っています。

早速ですが,仕事でアンケートを実施しました。
仕事の満足度をなにに求めるかというものです。
年代,性別,勤務歴と項目(給料,休暇数,福利厚生,人間関係)に満足度が高いようから順位をつけてもらいました。
そこで,年代や性別などで各項目に有意差があるかどうか統計をとりたいと思いました。
知識0からスタートして,2冊の入門書を読んだ結果,X^2検定ではないかと考えました。

そこで,質問させて下さい。
検定手法としてはX^2検定で問題ないでしょうか。
また,EXCELで計算する方法が本に書いてあったのですが,2冊とも計算した数値が違う状況です。ただ,数値は違うのですが,<P0.05にはなります。

統計を学んだことがなく,初歩的な問題で質問してしまい申し訳ありません。
是非アドバイスをお願いいたします。

No.07557 Re: 検定について  【青木繁伸】 2008/09/02(Tue) 20:21

架空例でもよいから,データと解析結果を付けないと,何がどうなっているのか分かりませんよねぇ
当然あなたがどのような計算をしたか(参考にした2冊の本の題名,出版社,参照ページ)そのようなものがないと何が何やら分からないとは思いませんか?

> 数値は違うのですが,<P0.05にはなります。

数値が違えば,決定的な違いです。

No.07559 Re: 検定について  【CEO】 2008/09/03(Wed) 08:39

返信ありがとうございます。
素人なので質問の仕方もわからず申し訳ないです。
データと解析方法をお伝えしたいと思います。
  
給料での満足度が高い人数    
1,2の順位を 3,4の順位を 合計
     つけた数   つけた数
20代 30(A1)    7(B1)  37(C1)
30代 16(A2)    12(B2)   28(C2)
合計 46(A3)   19(B3)    65(C3)

X^2値 C3*(A1*B2-B1*A2)^2/(A3*B3*C2*C1)=(D) X^2分布の片側確立値 CHIDIST(D,1)

30(A1) 16(B1)
37(A2) 28(B2)

統計量 (A1+B1)/(A2+B2)=(C)
検定統計量  ABS((A1/A2-B1/B2)/(C*(1-C)*(1/A2+1/B2))^0.5)=(D)
片側有意確立  1-NORMSDIST(D)

という計算を行いました。
,鉢△凌値は違うので困っています。
知識のある方ならこの結果を説明していただけると思って質問しました。
また,そもそも無理やりX^2検定を実施してもよいものかどうかも自信がないのです。
統計って本を読めば読むほど奥が深く,なかなか手強いですがこれからも継続して勉強していきたいと思っています。
ぜひ,アドバイスよろしくお願いします。

No.07561 Re: 検定について  【青木繁伸】 2008/09/03(Wed) 10:41

丸付き文字は使わないでくださいと,上の方でお願いしているところです

さて,(1) はいわゆるカイ二乗検定です(連続性の補正なし)
カイ二乗値は 4.415150685(あ) になっているはずで,あなたが片側確率値と思っているものは 0.035621138 ですね。しかし,本当に片側確率値が必要なら,その数値を半分にしないといけません。つまり,0.017810569(い) ですね。

(2) は比率の差の検定で,得られる検定統計量はいわゆる Z 値です。で,検定統計量は 2.101225996(う) となり,片側有意確率は 0.017810566(え) ですね。

(い)と(え)は本来同じ数値になるものです。まあ,小数点以下8桁まであっているので蘆としましょう(違いはエクセルのチョンボです)。
(あ)と(う)は同じでないけど,それは,(あ)はカイ二乗値,(う)は Z 値だからです。(う)を二乗すると 4.415150685 (お)となり,同じになりましたね。
つまり,今の場合必ず,「カイ二乗値=Z値の二乗」となるのです。

No.07562 Re: 検定について  【ひの】 2008/09/03(Wed) 11:19


 データは順序変数なのだからカイ二乗検定ではなくてU検定かクラスカル・ウォリス検定が適当だと思います。

No.07563 Re: 検定について  【CEO】 2008/09/03(Wed) 11:54

青木繁伸さま 
ご返信有難うございます。
丸付き文字を使用して申し訳ありません。
カイ二乗値=Z値の二乗
なるほど,確かにどの結果をいれても数値が一致しました。
これだと,20代と30代の間では満足度の基準に有意差があると判断できます。
逆に>p0.05だと年代による基準に差がないってことだと考えております。
親切にありがとうございました。

ひのさま
ご返信有難うごさいます。
U検定とはMann−WhitheyのU検定でしょうか?
確かに本にも記載されています。
年代別や性別による有意差を解析したいと思っているのですがU検定の方が適切でしょうか? 
カイ二乗検定とU検定とt検定とで,どれが適切かわからず,一番取り組みやすかったカイ二乗検定を実施してしまいました。
上記に書いてありますが,私はまったくの素人で,まだまだ理解できないことが多々あります。
ぜひとも,アドバイスなどよろしくお願いいたします。

No.07571 Re: 検定について  【ひの】 2008/09/04(Thu) 01:53


 ご自分のデータの尺度水準が何なのかをお確かめください。今回の場合は1点から4点までの得点を割り振ることのできるような順序尺度ですから,順序尺度の検定に適した方法を選ぶべきです。カイ二乗検定は名義尺度(カテゴリカルデータ)向きの検定です。

 まずは「尺度水準」についてお調べになることをお勧めします。

No.07572 Re: 検定について  【CEO】 2008/09/04(Thu) 10:12

ひのさま
早速のご返信有難うございます。

尺度水準を調べてみました。
たしかに順位がつくものは順序尺度だと記載されています。

できるかどうか不安ですが,EXCELを使ってU検定を行おうと思います。
また,結果がでたら報告します。
とりいそぎ,お礼申し上げます。
今後ともよろしくお願いいたします。

No.07573 Re: 検定について  【CEO】 2008/09/04(Thu) 12:42

U検定やってみました。結果,有意差なしとなりました。なかなか統計・解析の有効なポイントを見つけるのは難しい です。データを割合で表記するしかないと考えています。性差や年代差があると解析も楽しくやれると感じました。まだまだ,私の読みが浅く統計を考えたアン ケートの内容ではなかったと反省しています。いろいろ有難うございました。

No.07574 Re: 検定について  【青木繁伸】 2008/09/04(Thu) 12:57

> U検定やってみました。結果,有意差なしとなりました

上のデータを1〜4の順位を付けたものの数をまとめないで,以下のようなデータでやってみたのでしょうか?

  順位1 順位2 順位3 順位4 合計
20代  ○   ○   ○   ○   ○
30代  ○   ○   ○   ○   ○
合計  ○   ○   ○   ○   ○

有意差なしというのはちょっと不思議(まあ,そういうこともあるとは思いますけど)

> データを割合で表記するしかないと考えています

上のような表にすると良いと思いますけど??

> 性差や年代差があると解析も楽しくやれると感じました。

まあ,確かにネガティブデータの分析は味気ないですけど。

No.07576 Re: 検定について  【CEO】 2008/09/04(Thu) 17:23

青木繁伸さま
ご回答有難うございます。

ご指摘の通り年代別,性別,勤務歴別に順位をまとめずに計算しました。
どの解析も有意差なしとなりました。
EXCELを使って行い,関数間違いがないか再三チェックもしたのですが,残念ながら私が期待したような結果がでませんでした。
ご提示の表を円グラフの割合で表現してみようかと思っております。
割合では差があるようにみえるのに,実際の解析では有意差がないってびっくりもしましたし,いままでよくデータを見てなかったのだなって痛切しております。
ご指導ありがとうございました。

No.07577 Re: 検定について  【青木繁伸】 2008/09/04(Thu) 18:47

> EXCELを使って行い,関数間違いがないか再三チェックもしたのですが,残念ながら私が期待したような結果がでませんでした。

解析が正しいかどうか疑うというのは失礼なのですが,データを示してくれれば納得できるのですけどねぇ。データを示すわけにはいかぬというなら,やむを得ませんが。

No. 7574 で示したような形式で(有意でなかったという)どれか一つの例を示していただければと思いますけど。

No.07578 Re: 検定について  【CEO】 2008/09/05(Fri) 08:37

青木繁伸さま
ご回答ありがとうございます。
何回もお手数をおかけしますが,データを提示させてください。
給料の満足度 1  2  3  4  計
役職有    4  4  7  1 16
役職無   21 20 19  0 60
計     25 24 26  1 76
これをEXCELを使い計算しました。
z 1.267747389
p 0.102444088 よって>p0.05となり有意差なしと判断しました。
ご面倒をお掛けします。よろしくお願いします。

No.07579 Re: 検定について  【青木繁伸】 2008/09/05(Fri) 08:56

以下に示すように,マン・ホイットニーの U 検定はカイ二乗検定より小さなP値を産みます。
No. 7559 に示されたデータは,カイ二乗検定(比率の差の検定)で両側検定でも有意ですよね。このデータでも,「U検定やってみました。結果,有意差なしとなりました。」なんですか?呈示されるデータ・例がどうも適切でないなあという感じ。
> wilcox.test(rep(1:4, c(4,4,7,1)), rep(1:4, c(21,20,19,0))) マン・ホイットニーの U 検定

Wilcoxon rank sum test with continuity correction

data: rep(1:4, c(4, 4, 7, 1)) and rep(1:4, c(21, 20, 19, 0))
W = 579.5, p-value = 0.1819 これは両側検定のP値。
alternative hypothesis: true location shift is not equal to 0

> chisq.test(matrix(8, 8, 41, 19)) カイ二乗検定(両側検定)

Pearson's Chi-squared test

data: matrix(8, 8, 41, 19)
X-squared = 0, df = 280, p-value = 1 まるっきり差がないということ

No.07580 Re: 検定について  【CEO】 2008/09/05(Fri) 09:16

青木繁伸さま
アンケート結果を様々な切り口から考えていたのでデータを混乱しました。
給料での満足度が高い人数 (上記のデータから無効アンケート5を引いています)
           1      2     3      4     計
20代 17 13   6 0   36
30代    6 10 5 3 24
合計 23 23 11 3 60
これでカイ二乗検定もU検定も有意差なしとなりました。
言葉足らずで申し訳ありませんでした。
掲示板での質問経験もなく,質問方法もわからずにご迷惑をおかけしました。
ご指導有難うございます。

No.07581 Re: 検定について  【青木繁伸】 2008/09/05(Fri) 10:13

CEO さんが計算に使った Excel での U 検定は,正規近似によりP値を出しているようですが,可能な限り近似ではない検定を行うようお勧めします。

No. 7580 のデータで,マン・ホイットニーの U 検定を行うと以下のようになります。
exactRankTestsのwilcox.exact を使いましたが,(今回のデータでは)stats の wilcox.test もほぼ同様のP値になります。
両側検定でも,ギリギリのところで有意ですね。
  Package ‘exactRankTests’ is no longer under development.
Please consider using package ‘coin’ instead.
> wilcox.exact(rep(1:4, c(17, 13, 6, 0)), rep(1:4, c(6, 10, 5, 3)))

Exact Wilcoxon rank sum test

data: rep(1:4, c(17, 13, 6, 0)) and rep(1:4, c(6, 10, 5, 3))
W = 305, p-value = 0.0416  有意水準5%で有意です
alternative hypothesis: true mu is not equal to 0
2×4分割表としてカイ二乗検定をすると,
> chisq.test(matrix(c(17, 13, 6, 0, 6, 10, 5, 3), byrow=TRUE, ncol=4))

Pearson's Chi-squared test

data: matrix(c(17, 13, 6, 0, 6, 10, 5, 3), byrow = TRUE, ncol = 4)
X-squared = 6.6074, df = 3, p-value = 0.08552  有意ではありません
ということで,有意にはなりません。つまり,カイ二乗検定はマン・ホイットニーの U 検定より検出力が低いと言うことです。

No.07582 Re: 検定について  【CEO】 2008/09/05(Fri) 10:39

青木繁伸さま
丁寧なご回答ありがとうございました。
本の後ろのほうに正規分布とみなせないデータの解析というものをみつけましたので,早速EXCELにて計算してみます。
また結果がでましたら報告いたします。
ありがとうございました。

No.07583 Re: 検定について  【CEO】 2008/09/05(Fri) 11:49

上記のデータを計算した結果,有意差がありました。
ほかにも解析すると有意差がでる項目がありました。
データ(人間関係)
   1  2  3  4  計
男性11 10 17 19  57
女性 8  3  8  3  22
計 19 13 25 22  79 
上記のように有意差があるものもあるのですが,ほとんどは有意差がでません。同じ会社内のアンケートだから,全体の思考が似てくるのだと推測しました。このような場合では,内部・外部も含めて実施すれば比較がおもしろくなったのではと感じました。
いろいろとご指導有難うございました。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る