No.14342 カイ二乗検定について  【KK】 2011/02/20(Sun) 09:34

初めて,投稿させていただきます。
タイムサンプリングデータの統計的処理の方法についてです。
例えば,4回の食事場面のデータがあります。
各々の回の食事時間は異なります。
5秒ごとに,4つのカテゴリーに割り当てていきます。
更に,4回の食事場面を前半2回と後半2回に分けます。
カテゴリーごとに,前半の割合,後半の割合をだし,違いがあるかを検定したい場合,カイ二乗検定でよいのでしょうか。
例えば,以下のような表になります。

   カテゴリーA B   C D 合計
前半   30秒   640秒 120秒 46秒 836秒
後半   50秒   550秒 150秒 20秒 770秒

No.14344 Re: カイ二乗検定について  【青木繁伸】 2011/02/20(Sun) 10:41

あなたのいっているカイ二乗検定は,本来は計数データについてのものです。

> 5秒ごとに,4つのカテゴリーに割り当て

な らば,5秒を単位とする計数データと見られないこともないでしょうが,統計学におけるデータは,それぞれが独立でなければならないという大原則がありま す。あなたが定義している「カテゴリー」がどのようなものかはわかりませんが,ある一つのカテゴリーに該当する行動が5秒以上連続する場合は隣り合うデー タは従属になるでしょう。

このデータは幾つも突っ込みどころのあるものだと思いますが,もし1秒や10秒を単位としたときに結果が変わっ てきますね。つまりデータの個数(サンプルサイズ)が変わります。同じ食事を分析するのに,単位を1秒にするとデータの個数は5倍になります。10秒にす ると半分になります。そうすると,検定結果が異なります。どのような単位が最適であるかが事前に分かっていればよいですが,そうでないときには悩みます ね。

もうひとつ。このデータ(4回の食事)はある一人の人についてのものでしょうか?一人のものであるならば,データの独立性,更にそれを前半と後半に分けた場合にも,データの独立性の点で問題があるでしょう。

また,1人や4人のデータを検定することの意味が問われるべきものではないでしょうか?一人のデータで検定をして,有意な差があったとしても,それを普遍化できないですよね。

No.14347 Re: カイ二乗検定について  【KK】 2011/02/20(Sun) 17:13

早速にお返事いただいてありがとうございます。
データは,一クラス分ですから,20人前後です。お示ししたデータは例ですので,秒数は適当でしたが,20人分なので,一つのセルに入る数字はもっと大きくなります。観察時間を5秒単位で分けたものが,4つのカテゴリーにすべて分けられます。

観察時間内に占めるカテゴリーの割合の前半と後半の差を検定するのに,カイ二乗は無理があるでしょうか。

また,前半と後半の差ではなく,例えば,3歳児クラスと4歳児クラスの差を見る場合は,如何でしょうか。

よろしくお願いいたします。

No.14348 Re: カイ二乗検定について  【青木繁伸】 2011/02/20(Sun) 19:02

複数の被検者のデータであるならなおさらのこと,データの独立性に注意が必要でしょう。(被検者ごとに生成されるデータの個数の違いとか。)
特殊なデータの場合には,データの採種の段階から,どのようなデータ解析手法を採用するか詳細な検討が必要と思います。

No.14349 Re: カイ二乗検定について  【青木繁伸】 2011/02/20(Sun) 20:02

> 20人分なので,一つのセルに入る数字はもっと大きくなります

だとすれば,データの扱 いは余計に問題があるでしょうね。各人数のデータは応分にカウントされているのでしょうか?それとも質問文にあったように各人の食事時間自体に違いがある のならば,対象時間の長い被検者のデータは短い被検者のデータより重みが多くなっているのではないでしょうか?

そもそもの所が,検定になじまないというところは意見が一致するのでしょうか,しないのでしょうか。
例えば,食事中の事象として,素人ながら,食事本来の所要時間,他人との会話の時間,その他の時間などとあったとき,どれかがどれかと比べて多い・少ない,どれかがどれと比べて何倍などといいたいときに,検定は必要でしょうか?

基本に帰って,これが計数データなのか,分布の差の検定になじむデータなのかを考察すると良いと思います。データの細かい条件はあなたにしか分からない部分もあるのでしょうから,あなたが判断するしかないと思います。

No.14351 Re: カイ二乗検定について  【KK】 2011/02/21(Mon) 03:56

お返事をありがとうございます。
食事時間は,例えば給食のように,クラス単位で行う場面なのですべての子どもにとって時間は同じになります。
しかし,回によって,その時間に長短はあります。
時間は連続していますが,このデータについては,5秒ごとに独立したデータとして見なして,検定しようと思っていました。

検定になじまないデータの場合,検定はせずに,割合だけを提示し,その数字で,どのカテゴリーがどのような場合に多いとか,少ないとかを考察することになるのでしょうか。

統計についてよくわかっていない点が多く,申し訳ありません。
よろしくお願いいたします。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る