★ データ解析・初歩的な疑問???? ★
63 データ解析・初歩的な疑問???? ドナルド 2001/03/08 (木) 11:40
66 Re: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 15:38
71 Re^2: データ解析・初歩的な疑問???? ドナルド 2001/03/08 (木) 21:14
72 Re^3: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 23:45
73 Re^4: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 23:46
76 Re^5: データ解析・初歩的な疑問???? ドナルド 2001/03/09 (金) 09:39
74 Re^5: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 23:47
77 Re^6: データ解析・初歩的な疑問???? ドナルド 2001/03/09 (金) 09:40
81 Re^7: データ解析・初歩的な疑問???? 中原 2001/03/09 (金) 22:41
86 Re^8: データ解析・初歩的な疑問???? ドナルド 2001/03/11 (日) 10:40
79 Re^7: データ解析・初歩的な疑問???? DISIR 2001/03/09 (金) 14:01
75 Re^6: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 23:54
63. データ解析・初歩的な疑問???? ドナルド 2001/03/08 (木) 11:40 |
アンケート調査の結果の解析のご相談をさせてください。
カイ自乗を行おうと思うのですが,無回答だった人は解析から除外してしまっても問題はない,ですよね?2×kを適用しました。「2」は当てはまる,当てはまらない。で,kが群です。Aを好む群,Bを好む群,Cを好む群およびその他を好む群の4群です。この結果有意差がみられたので,実際にどの群間に差があるのかを示すために多重比較を行いたいのですが,このまま多重比較を行うと,Aとその他やCとその他で有意差がみられる可能性だってあり得ますよね?でも最終的な結果として文章で示すときに「A群とその他群との間には有意な差がみられた」と表現するのは,なんだかすっきりしない気がします。でも,その他を選択している人がいるからには,この人たちの回答を除外してはいけない気がする。どなたか,Help me!!! |
[このページのトップへ]
66. Re: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 15:38 |
> 2×kを適用しました。「2」は当てはまる,当てはまらない。で,kが群です。Aを好む群,Bを好む群,Cを好む群およびその他を好む群の4群です。この結果有意差がみられたので,
ちょっと,逆に質問したいのですが。
以下のような表が得られたと言うことですか。
当てはまる 当てはまらない 合計
Aを好む ○○ ○○ ○○
Bを好む ○○ ○○ ○○
Cを好む ○○ ○○ ○○
その他 ○○ ○○ ○○
合計 ○○ ○○ □□
さて,たとえば100人に聞いたとき,□□の箇所の数値はいくつになりますか?
つまり,Aを好むという群で,当てはまるというのは何にあてはまるんですか?
「Aを好む」ということに当てはまるんですか?ということです。 |
[このページのトップへ]
71. Re^2: データ解析・初歩的な疑問???? ドナルド 2001/03/08 (木) 21:14 |
> ちょっと,逆に質問したいのですが。 以下のような表が得られたと言うことですか。
言葉っ足らずでした,ごめんなさい。できるだけ具体的に述べてみますと,
質問1:どのような食事を好みますか?
A.日本料理 B.中華料理C.フランス料理D.スペイン料理E.イタリア料理F.ドイツ料理
質問2:あなたは東京都民ですか?
はい いいえ
といったかんじの質問構成です。集計の際,質問1のD-Fは選択した人が極端に少なかったのでその他に統合しました。また質問1対しては無回答の人がいました。つまり,
質問2
都民である 都民でない 合計
Aを好む ○ ○ ○
質 Bを好む ○ ○ ○
問 Cを好む ○ ○ ○
1 その他 ○ ○ ○
合計 ○ ○ □
といった表です。
> さて,たとえば100人に聞いたとき,□の箇所の数値はいくつになりますか?
質問1に対して無回答だった人を解析から除外しようと思うので,100にはなりません。 |
[このページのトップへ]
72. Re^3: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 23:45 |
このような表を解釈するときには,以下のように考えるのがよいのではないでしょうか。
「東京都民とそれ以外の人では,好みに違いがある」
なぜ,
「あることに対する好みは,東京都民とそれ以外の人で違いがある」といわないのか? |
[このページのトップへ]
73. Re^4: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 23:46 |
つづき
それは,因果関係(時間の前後性)を考えるからでしょう。
この違いは,縦方向にパーセントをとるか,横方向にパーセントをとるかの違いです。
あなたは,どちら方向にパーセントをとりますか?
Aが好き Bが好き Cが好き Dが好き Eが好き …が好き Zが好き 合計
東京都民 ○○ ○○ ○○ ○○ ○○ ○○ ○○ ○○
それ以外 ○○ ○○ ○○ ○○ ○○ ○○ ○○ ○○
合計 ○○ ○○ ○○ ○○ ○○ ○○ ○○ ○○
この表で,横方向のパーセントを取るんです。
そうすると,たとえば「Aを好きなのは東京都民では△△%だが,それ以外では□□%である……」という記述をすることになりますね。つまり,行方向に100%になるようにパーセントを取ったときには,列方向に並ぶ数値を比較してどこの数値が大きいかを記述するんです。(行方向にパーセントをとっても,列方向にパーセントをとっても,検定をするときには無関係です) |
[このページのトップへ]
76. Re^5: データ解析・初歩的な疑問???? ドナルド 2001/03/09 (金) 09:39 |
中原様
懇切丁寧なご回答ありがとうございます。今まで縦方向ばかりに固執していたのでそれがいけなかったのですね。もっと頭を軟らかくしなくては・・・(´`)ゝ
ただまだ多重比較についての疑問が残るのですが,確かに
> 「Aを好きなのは東京都民では△△%だが,それ以外では□□%である……」
ということはいえるのですが,この△△%と□□%との間に有意な差があるとはいえないのではないか,ということです。私はあくまでも,結果に有意な差がみられるかどうかをいいたいのです(コチコチの石頭ですね・・・)。
カイ自乗検定をすることによって東京都民とそれ以外の2群間において反応カテゴリーに有意な相違があるかどうかはいえると思います。東京都民のほうがAを好む人の比率が大きいとしても,必ずしもそこに有意な関係があるとはいえないのですよね?「Bを好きな人の比率は都民以外の人が有意に多いが,それ以外の好みには有意な差がみられない」というときでも,カイ自乗検定に有意差が検出されるのですよね?
|
[このページのトップへ]
74. Re^5: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 23:47 |
つづき
しかし,列方向にパーセントをとるか列方向にパーセントをとるか,この違いは大きいです。この違いがわかるかどうかは,統計学的センスがあるかどうかというよりは,現象(データ)をどのように解釈するか理解するかのわかれめです。
前者のように考えると,多重比較をする必要もないし,その他をどのように取り扱うかも考えなくていいですね。
> > さて,たとえば100人に聞いたとき,□の箇所の数値はいくつになりますか?
> 質問1に対して無回答だった人を解析から除外しようと思うので,100にはなりません。
私が聞きたかったのは,無回答者を除くことによる数値の違いではありませんでしたが,それ以前の解答から,答えは得られました。 |
[このページのトップへ]
77. Re^6: データ解析・初歩的な疑問???? ドナルド 2001/03/09 (金) 09:40 |
つづき
くどくなりますが,都民とそれ以外の2群間では,実際にどのカテゴリーに有意な差があるのかをいいたいのです。
まだ頭の固いことをいっているのかもしれませんが,こうなるとやはり多重比較なのかなーと・・・。 |
[このページのトップへ]
[このページのトップへ]
86. Re^8: データ解析・初歩的な疑問???? ドナルド 2001/03/11 (日) 10:40 |
DISIR様,中原様,レスありがとうございます。
実際にBonnferoniにかけてみました。例に出したものと同質のデータがいくつかあるのですべてやってみたのですが,帰無仮説が6個たちそのうちの5個に有意差があったりして,文章にするにも棒グラフで示すにしてもなんだかすっきりしない結果となってしまいしました。。。それにしても,東京と大阪のテレビのチャンネルの例題,有名とのことですが知りませんでした。お恥ずかしい,まだまだ勉強不足ですね。(´`)ゞ
> 残差分析くらいでいいのでは(私としてはお勧めではないが)
名前は聞いたことがあるのですが,実際にどんなものなのか知りませんので,さっそく教えていただいたスレッドなり本なりで勉強してみます。
|
[このページのトップへ]
79. Re^7: データ解析・初歩的な疑問???? DISIR 2001/03/09 (金) 14:01 |
横レスします。中原さんごめんなさい。
これって東京と大阪のそれぞれ代表校で日曜日の7時からどのチャンネルにしていたか調べて,その比較をするっていう,よく例題に使われるのと同じじゃないの?
東京と大阪の2群で全体を比較して,参考までに,それぞれのチャンネル(料理)の比率の差と信頼区間を記載するぐらいがいいんじゃないかな?この場合なら,東京都民とそれ以外ね。
検定したければしてもいいと思うけど,少々αインフレでもこのアンケートの内容なら気にしなくてもいいけと思うけど(人の生き死にとか経済的に大きな判断をすえうわけでもなし),どうしても気になるならBonferroniで調整すればいいんじゃないかな?問題勘違いしてたらこのレスは無視してください。 |
[このページのトップへ]
75. Re^6: データ解析・初歩的な疑問???? 中原 2001/03/08 (木) 23:54 |
とどめ(^_^;)あるいは,結論
ようするに,「群」は,「東京都民である」と「東京都民ではない」の2群なんです。
なにが好きかは,それぞれの群に属する対象者の反応なのです。
なにが群(母集団中の小集団(サブグループ))であるかを見極めることが大切です。 |
[このページのトップへ]
● 「統計学関連なんでもあり」の過去ログ--- 013 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る