No.20217 2群とか3群の有意検定  【経営者】 2013/09/09(Mon) 15:10

実際の生々しい話は出来ないので,以下,架空の事例に変えています。長文ですが,よろしくお願いします。
何らかの有料サービスがあって,お客様の自己申告に基づき代金を徴収するとします。
(例えば,有料トイレに入って,手を洗ったら10円,トイレットペーパーを使ったら20円,鏡を見たら10円・・・など。)
そして,そのサービス施設の入り口で,毎日アルバイトの人が自己申告に基づき代金を徴収します。このアルバイトは,毎日一人ずつが交代で担当しています。係員はお客様がどのサービスを利用したか分からず,自己申告に基づきお金を受け取るだけです。
仮にAさん他数名で1年間この仕事をした結果,毎日データが残っているとします。(例えば,Aさんが165日,それ以外の人が200日など。)
と ころが,Aさんが,代金の一部を着服しているのではないかという疑いがあり,調べてみると,Aさんの1日当たりの平均徴収額が1200円であるのに対し て,それ以外の人の平均は2500円であったとします。(Aさん以外はいずれも平均が2500円前後であって,大きな不正はないと思われる。)
感覚的に,これだけのサンプル数があって,これほど平均値が違うということは偶然ではないと思いますが,これが偶然であるか確率(例えば1億分の1とか1兆分の1とか・・・)を出したいと思います。

● 帰無仮説 Aさんの徴収額はそれ以外の人と同じ平均,同じ分散である(数字の違いは偶然である。)
● 対立仮説 Aさんの徴収額の平均は有意に低い。

こ の,偶然である確率を推定するのに,どのような方法がいいでしょうか?ちょっと見た感じでは,t検定がいいと思うのですが・・・。このとき,Aさんとそれ 以外で分散が違っているかどうかの検証をすべきでしょうか?個人的には,分散が違っていれば,その時点でなんらかの不正が行われているということになり, その時点で答えが出てしまうため,意味がないと思っていて,分散のF検定は不要だと思いますが・・・
また,Aさんが不正をしているのであれば,もはや確率ではなく,恣意的な操作になってしまうので,Aさんの分散というのはあまりあてにならないのではないでしょうか?
● t検定を用いるのは妥当でしょうか?
● この場合,分散はどの分散を使えばいいでしょうか?
● Aさんは大きく不正しているとして,そのほかにも少しは不正しているようなことがある可能性もあることはあるでしょうが,それは無視してAさんとそれ以外で比べていいのでしょうか?
● 仮にAさんが最も疑わしくて,Bさんも多少疑わしい・・・という場合はいかがでしょうか。
いずれにしてもどのような検定がいいか教えていただければ幸いです。
事 前に多重比較をすることも考えるべきだと思いますが,Aさんが極端に低くて,それ以外の人たちは同じような数字である場合,多重比較をしてわざわざ複雑に することもないと思いますし,この有意水準5%等で多重比較をやっても,最終的にAさんの差異が偶然である確率はは1億分の1とかそのようになると思いま すので,数字がかけはなれていて,意味がないと思います。

以上,よろしくお願いします。

No.20237 Re: 2群とか3群の有意検定  【経営者】 2013/09/17(Tue) 10:56

上記についてですが,いろいろと個別にメールのやりとりなどをした結果,マン・ホイットニーのU検定というのがぴったりくると思っています。
(こ れは個人の感覚ですが)不正をしたという時点で,平均は確実に下がりますが,不正着服の場合,操作が恣意的になり,毎日1000円ずつ着服する人,あるい は毎日決まった金額だけ納入する人,あるいはタバコが買いたい日だけタバコ代分を着服する人等いろいろいますが,不正が行われた時点で,正規分布やT分布 に従わないとともに,標準偏差も検定をする際にあてにならなくなります。
そうすると,U検定のように,標準偏差をサンプルから出さなくてもいいという手法が最も適しているような気がします。
これに対して,ご意見等ありましたら,よろしくお願いします。

結果的には,まずまず,T検定と同じような結果が出ました。(10のマイナス14乗分の1とかそんな値です。)

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る