★ カイ二乗と分散分析 ★

7773. カイ二乗と分散分析 sato 2005/09/26 (月) 18:32
└7775. Re: カイ二乗と分散分析 青木繁伸 2005/09/26 (月) 18:42
 └7776. Re^2: カイ二乗と分散分析 sato 2005/09/26 (月) 21:05
  └7777. Re^3: カイ二乗と分散分析 青木繁伸 2005/09/26 (月) 21:40
   ├7780. Re^4: カイ二乗と分散分析 にゃんちゅう 2005/09/27 (火) 22:58
   │└7781. Re^5: カイ二乗と分散分析 青木繁伸 2005/09/27 (火) 23:06
   └7778. Re^4: カイ二乗と分散分析 青木繁伸 2005/09/26 (月) 22:31


7773. カイ二乗と分散分析 sato  2005/09/26 (月) 18:32
言語学を勉強してい学部生です。
日本人(15名)とアメリカ人(15名)の発話方法が
異なるかどうかを明らかにしたいと思っています。

その際,
(1)一談話に占める使用方法の割合を平均し,比較すべきなのか,
(2)使用方法の個数で比較すべきなのか,
さえも分からなくなってきました。
尺度は名義尺度なのでしょうか,間隔尺度なのでしょうか。
その上,どの検定を用いるべきかもわからなくなってきました。


(1)の場合
一人一人,各方法ごと,使用数/全Tユニット数で割りました。
そして,平均を出しました。

  方法1 方法2 方法3 方法4 方法5 方法6
-------------------------------------------------------
日:52.19% 27.03% 13.02% 4.05% 0.00% 7.33%
米:65.24% 27.03% 6.56% 3.80% 2.05% 1.60%
-------------------------------------------------------

(2)の場合
1談話に含まれるTユニット一つ一つが,
6つの発話方法のどれに当てはまるか,一つ一つ評定しました。
その結果,以下のようなクロス表ができました。
(ユニット数でまとめました。)

  方法1 方法2 方法3 方法4 方法5 方法6
-------------------------------------------------------
日:225   95   44   15   0   14
米:600   155   22   44   30   14
-------------------------------------------------------

私の質問の意図をわかっていただけますでしょうか。
ご教授お願いします。

     [このページのトップへ]


7775. Re: カイ二乗と分散分析 青木繁伸  2005/09/26 (月) 18:42
>   方法1 方法2 方法3 方法4 方法5 方法6
> -------------------------------------------------------
> 日:52.19% 27.03% 13.02% 4.05% 0.00% 7.33%
> 米:65.24% 27.03% 6.56% 3.80% 2.05% 1.60%
> -------------------------------------------------------

このやり方では,分母の数が持っている情報が無視されています。

10の内の5でも,1000の内の500でも,同じく50%になってしまうと言うのは,言語道断だとは思いませんか?


な お,どんな表を作るにしろ,観察単位をしっかり考えておかないと,とんでもない表になります。集計表の総合計が全観察単位数になるか,100%になるかで ないと,作った集計表はインチキ集計表です。対応のあるデータと対応のないデータの区別さらに前者では,何個のデータが一組の対応のあるデータなのかなど ちゃんと考えておく必要があります。場合によっては,一つの二次元集計表では表現できないこともあるでしょう。

     [このページのトップへ]


7776. Re^2: カイ二乗と分散分析 sato  2005/09/26 (月) 21:05
先生,お返事ありがとうございました。

> このやり方では,分母の数が持っている情報が無視されています。
ということは,
角変換をして分散分析を行うべきだということですか。
それとも,それもよくないのでしょうか。

下記のクロス表でカイ二乗を行う場合,
期待度数が5以下のものが出てきました。
SPSSがFisherの直説法を勝手にしてくれるのかなぁ,
と思っておりましたが,出てきませんでした。
これは,私の方法が何か間違っていますか。
また教えていただけませんでしょうか。

  方法1 方法2 方法3 方法4 方法5 方法6
--------------------------------------------------
日:225   95   44   15    0   14
米:600   155   22   44   30   14
--------------------------------------------------

> 集計表の総合計が全観察単位数になるか,100%になるか
これは,横に足して100%じゃだめなんでしょうか。

> 対応のあるデータと対応のないデータの区別
日,米は「対応のないデータ」です。
方法1から6までは「対応のあるデータ」です。

     [このページのトップへ]


7777. Re^3: カイ二乗と分散分析 青木繁伸  2005/09/26 (月) 21:40
> 角変換をして分散分析を行うべきだということですか。
> それとも,それもよくないのでしょうか。

割合データについては角変換ということもありますよと言うことでしょう。
その前に,何が分母で何が分子でというのをちゃんと定義することが先決でしょう。

> 下記のクロス表でカイ二乗を行う場合,

それが正しいかどうか,これ以降の描かれた内容を見ると,曖昧ですね。

> 期待度数が5以下のものが出てきました。
> SPSSがFisherの直説法を勝手にしてくれるのかなぁ,
> と思っておりましたが,出てきませんでした。
> これは,私の方法が何か間違っていますか。

直接確率法を選ばないとやってくれないと思います。

> また教えていただけませんでしょうか。
>
>   方法1 方法2 方法3 方法4 方法5 方法6
> --------------------------------------------------
> 日:225   95   44   15    0   14
> 米:600   155   22   44   30   14
> --------------------------------------------------
>
> > 集計表の総合計が全観察単位数になるか,100%になるか
> これは,横に足して100%じゃだめなんでしょうか。

失礼しました。横または縦で100%ということです。
しかし,どんな数字が並べられていても合計に対するそれぞれの%を計算するのですから,100%になるのは明らかです。それより合計欄に書く数字を得るために各桝目の数値を足して良いかどうかが問題なのですね。
うえのような表で,後ろの方で方法1〜6は対応があるといっておられるが(私は対応があるとは思えないですが),本当に対応があるなら合計してはいけないと思いますよ。

> > 対応のあるデータと対応のないデータの区別
> 日,米は「対応のないデータ」です。
> 方法1から6までは「対応のあるデータ」です。

同じ被検者を方法1から6の状況下で観察してということなのですか?

それと,この数値はそのような状況下で観察された回数として,同じ一人の人が関与しているのですかそれとも何人かの被検者が関与しているのですか(日・米ということではなく,日本人だけの場合でも何人かの被検者なのか一人なのかということ)

同じひとを6通りの状況下においたとして,その観察数値が得られる分母は6通りの状況下で等しいのですか。

もし,おっしゃるとおりに,1〜6が対応があるとしたら,上に上げられた分割表をカイ二乗検定を行うことはできないでしょうね。

     [このページのトップへ]


7780. Re^4: カイ二乗と分散分析 にゃんちゅう  2005/09/27 (火) 22:58

> > 期待度数が5以下のものが出てきました。
> > SPSSがFisherの直説法を勝手にしてくれるのかなぁ,
> > と思っておりましたが,出てきませんでした。
> > これは,私の方法が何か間違っていますか。
>
> 直接確率法を選ばないとやってくれないと思います。

2x2 以外では計算しないでしょう。

     [このページのトップへ]


7781. Re^5: カイ二乗と分散分析 青木繁伸  2005/09/27 (火) 23:06
>
> > > 期待度数が5以下のものが出てきました。
> > > SPSSがFisherの直説法を勝手にしてくれるのかなぁ,
> > > と思っておりましたが,出てきませんでした。
> > > これは,私の方法が何か間違っていますか。
> > > > 直接確率法を選ばないとやってくれないと思います。
>
> 2x2 以外では計算しないでしょう。

あ,そうそう。Exact パッケージを入れていないと2×2以外ではオプション選択もできませんね。

     [このページのトップへ]


7778. Re^4: カイ二乗と分散分析 青木繁伸  2005/09/26 (月) 22:31
蛇足ですが,二次元集計表の作られ方について述べておきます
因果関係まで考えれば3通りありますが,2通りにまとめます。

1:複数のグループごとに観察単位を用意し,それぞれの観察単位がどのカテゴリーに属するかカウントする
 例 日本人とアメリカ人の ABO 式血液型の分布が同じかどうか調べる
 観察単位 人
 できる集計表
           A型   B型   O型  AB型   合計
   アメリカ人  ○○  ○○  ○○  ○○   ○○
   日本人    ○○  ○○  ○○  ○○   ○○
   合計     ○○  ○○  ○○  ○○   ○○
 注意点  予算などで調査可能人数が限られるなら,
      グループごとに同じ人数を採るのが最適

2:観察単位を調べて二つの変数の組み合わせでどのカテゴリーに属するかをカウントする
  例 国により ABO 式血液型の分布が同じかどうか調べる
  注 上の例と似ているが,観察対象が決まるときに事前に何国人かわからない。だから,調査した結果アメリカ人は一人もいなかったということだって生じる(場合によってはそんなことの方が普通のことであることの方が多い!)
  集計単位,できる集計表は上と同じ。

では,以下のようなものはどうか。
ある診療所に来る風邪ひき患者にある治療をした場合と,しない場合,風邪が2日以内に治るかどうか,一冬を通して記録した。同じ人が2回以上風邪をひいて診療所に来たこともある。。。
何が観察単位か。二回以上来た人はどう扱うべきか。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 035 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る