No.06002 外れ値の取り扱いについて  【笹田】 2008/03/03(Mon) 12:06

初めて投稿させて頂きます。
データ処理等について初心者でして,初歩的な質問で恐縮ですが,ご教授頂けましたら幸いです。

被験者10名で運動介入で介入群とコントロール群の皮下脂肪の厚さを調べていますが,
検者,測定部位は同一にもかかわらず,プローブの当て方により数値がばらついてしまいます。
そこで,5回計測して,外れ値を棄却して平均値を算出して比較しようと思いますが,この方法は適しているのでしょうか?
Kolmogorov-Smirnov検定ではサンプル数が足りなく,検定にかけられないため,SPSSの箱ひげ図で外れ値になったものを棄却しようと考えています。
ご指導頂けましたらよろしくお願いいたします
                  被験者A         被験者B
介入前 介入後 介入前 介入後
測定1回目 12.5 15.1 40.7 43.6
測定2回目 17.4 16.6 48 48.5
測定3回目 21.8 16.7 49.6 49.7
測定4回目 23.8 17.6 49.9 56.5
測定5回目 25 18.3 52.1 57.1

No.06003 Re: 外れ値の取り扱いについて  【青木繁伸】 2008/03/03(Mon) 13:26

測定値がこれだけばらつく状況下で,平均値をとって介入前後の変化を見るというのは問題があるのではないでしょうか。
た とえば被検者Aの場合,介入前の5回の測定値の範囲は25-12.5=12.5もあるのに介入前の5測定値の平均と介入後の5測定値の平均の差は 20.10-16.86=3.24しかありません。つまり,効果判定のための判定値が測定誤差より小さいのです。もう一つ言えば,測定値の誤差(範囲)が かなり大きいのに,測定値の平均値を取ってしまえばその情報が失われてしまいます。被検者Aの例で言えば,たとえば (20.9, 20.0, 19.2, 19.6, 20.8) のような測定値の平均値も同じく20.1になるが,測定値のバラツキは全然違いますよね。それを同じように扱うことになるのはやはりどこかおかしいですよ ね。

No.06005 Re: 外れ値の取り扱いについて  【笹田】 2008/03/03(Mon) 16:16

早速の丁寧なご返信,有難うございます。
この場合,試行回数が少ないのですが,
どのような方法で棄却検定を行うのが最良なのでしょうか?
正規性の検定ではサンプルサイズが小さいせいか,正規性が認められないのですが。

No.06006 Re: 外れ値の取り扱いについて  【kai】 2008/03/03(Mon) 16:51

質問とはずれますが,

>プローブの当て方により数値がばらついてしまいます。

もしこれが本当なら,プローブの当て方が一定になるような測定方法,治具を考えた方が良質なデータが得られて解析も簡単になると思いますが...
解析においてデータの質は非常に重要だと思います.

No.06007 Re: 外れ値の取り扱いについて  【青木繁伸】 2008/03/03(Mon) 17:06

> この場合,試行回数が少ないのですが,どのような方法で棄却検定を行うのが最良なのでしょうか?

外 れ値を棄却したいのですか?被検者ごとに,介入の前・後別にでしょうか?5つのデータの正規性や,外れ値検定というのはなかなか難しいでしょう。やるとし たらの話ですが,よくやられる方法で,最大値と最小値を除いた3つで平均値というのもあるかとは思いますが,いずれにせよNo.6003で述べたように, また,No.6006でも書かれたように,測定精度を上げるのが先決かと思います。

No.06017 Re: 外れ値の取り扱いについて  【笹田】 2008/03/04(Tue) 08:42

貴重なご意見,有難うございます。ご指摘いただいたように,まずは測定精度について検討を加える形で考えていきたいと思います。

No.06018 Re: 外れ値の取り扱いについて  【青木繁伸】 2008/03/04(Tue) 10:06

> 正規性の検定ではサンプルサイズが小さいせいか,正規性が認められないのですが。

サンプルサイズが小さいと,帰無仮説(正規分布に従う)は採択されやすくなるはずですが,おかしいですね。どうやって検定しているのですか。Rだと,次のようになりますけど(被検者A,介入前のデータ)
> x <- c(12.5, 17.4, 21.8, 23.8, 25)
> library(fBasics)
> ks.test(x, "pnorm", mean=mean(x), sd=sd(x))

One-sample Kolmogorov-Smirnov test

data: x
D = 0.2296, p-value = 0.9018
alternative hypothesis: two-sided

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る