No.15238 離散データにとってのANOVAにあたる  【芽原】 2011/08/24(Wed) 09:26

フリースローの練習方法の有効性を確認しようとしています。
学生をランダムに10人ずつ3つのグループにわけて,それぞれ異なるメニューで練習します。その後に,各自10本ずつスローして何本入るかを記録します。
スローの数がとても多いのならたぶんANOVAで群間差を検定して良いのだと思うのですが,こういう離散データに対応した方法はございましょうか?
個人差が大きそうなので,「群でカテゴリーを併合して独立性の検定をする」のは避けようと思っています。
よろしくお願いします。

No.15240 Re: 離散データにとってのANOVAにあたる  【ひの】 2011/08/24(Wed) 10:56

練習開始前に各自10本ずつスローして何本入るかを記録しておかないと練習の効果があったかどうか確かめられないのでは?
連続量であってもデータにした時点で離散量になるので,データの尺度だけを気にすればよいでしょう。この場合は測定精度が荒いだけで比例尺度として普通に取り扱って問題ないとおもいます。

No.15248 Re: 離散データにとってのANOVAにあたる  【芽原】 2011/08/24(Wed) 14:54

ひの様;
ご回答ありがとうございます。

後学のために,スローの数が少ない・あるいは成功率が低くて精度に難がありそうなときのことを伺ってよろしいでしょうか?

(カテゴリーを併合した)カイ二乗検定では,あるモデルからの乖離を,それぞれのカテゴリーでの期待値との差から検出します。これで求められるのは,(離散データとなる)検出方法ないし回数のせいで偶然にその差以上の値が得られてしまう確率だとおもいます。

一方,ANOVAは群間分散と群内分散とから,個人差を考慮しながらその差以上の値が偶然で得られてしまう確率を求めているのだとおもいます。

実際には,精度と個人差が両方,効いてくるような気がするのです。そこで,離散データを,個人差を考慮して解析する方法があればなあと愚考する次第であります。

No.15266 Re: 離散データにとってのANOVAにあたる  【ひの】 2011/08/27(Sat) 22:43

離散データかどうかという問題と離散量かどうかという問題を混同しておられますね。
統計学で実際に扱うデータは全て離散データです。連続量であってもデータ化するときにかならず離散データになります。
今回のケースでは扱っている量は連続量です。離散データではあってもカテゴリカルデータではありませんのでカイ二乗検定を適用するのは間違っています。
精度が気になるなら精度を上げる方法を考えましょう。スローの回数を増やすか被験者を増やすかすれば済む話です。

No.15271 Re: 離散データにとってのANOVAにあたる  【芽原】 2011/08/29(Mon) 10:53

ひの様;

また御回答をありがとうございます。この場合,問題になっている本質は成功率という(ある意味,仮想的な)連続量であり,ただ測定の方法がフリースローなので,得られるデータが離散的になるということですね。

#とはいえ,カイ二乗検定を非カテゴリカルデータに適用するのが誤りだというのは,いかがなものでしょうか?
#これはモデルからの乖離を離散データから推定するためによく使われる方法だと思ったのですが?

もうひとつだけ;
ANOVA では,偶然に群内分散が小さく見積もられるケースが生じると思います,たとえば二項分布で期待されるばらつきよりも小さくなることがあろうかと思います。 扱っているのが連続データであれば,これは仕方ないことですが,離散データであれば,原理的にある値以下の群内分散になり得ないことは予測できます。

こうした(離散データであるがゆえの精度の限界を)ANOVAに反映させる良い方法をご存知でしたら,お教えください。

No.15272 Re: 離散データにとってのANOVAにあたる  【ひの】 2011/08/29(Mon) 12:08

>#とはいえ,カイ二乗検定を非カテゴリカルデータに適用するのが誤りだというのは,いかがなものでしょうか?

順序尺度以上のデータをカイ二乗検定で検定するのは,値の大小関係という重要な情報を捨ててしまうことになるので明らかに検定の検出力が落ちますし,そもそも何を検定をしているのだかわからなくなります。U検定またはクラスカルウォリス検定にすべきデータです。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る