No.06897 生データが従属変数の場合の取り扱い  【MK】 2008/06/26(Thu) 16:43

研究データの取り扱いで困っているので,どなたか参考文献などのヒントをいただけないでしょうか。

現在行っている研究で出てくるデータが,カイ二乗検定で使えるような観察値(整数)ではなく,また身長や体重のような絶対値でもありません。

具体的には,ある素材の全体像を機器分析により詳しく解析すると,どのような部分形状がどれぐらいの割合で含まれるかがデータとして出力されます。

例えば,形状A:30%,形状B:35%,形状C:20%,形状D:15%などというデータで,合計は100%になります。

このような素材を2種類以上で比較し,部分形状の割合に有意差があるかどうかを検定したいと考えています。

このような場合,自由度を減らし,単純に割合の数字(30,35,20,15)を観察値として扱い,カイ二乗検定にかけてもいいものでしょうか。(独立性がない上に,観察値ではないので多分ダメですよね…。)

統計の教科書を探してもなかなか同じような解析例がなく,非常に困っています。どうかよろしくお願いいたします。

No.06898 Re: 生データが従属変数の場合の取り扱い  【青木繁伸】 2008/06/26(Thu) 17:27

部分形状が連続的に変化するものではないでしょうし,こういうのは検定対象にならないでしょう。

> カイ二乗検定にかけてもいいものでしょうか

あなたが感じているとおり,よくありません。

No.06914 Re: 生データが従属変数の場合の取り扱い  【MK】 2008/06/27(Fri) 14:22

青木先生

アドバイスをいただきありがとうございます。学術誌に投稿するにあたり,素材間だけでなく,ある素材に対する加工処理前後で客観的に違いがあることも示したかったのですが,少々厳しいようですね。

>部分形状が連続的に変化するものではない

こ の点ですが,薬品を使った加工処理をすると,例えば(形状A:30%,形状B:35%,形状C:20%,形状D:15%)から(形状A:10%,形状 B:15%,形状C:40%,形状D:35%)へと連続的に(?)変化はすると思います。(ただ,変性などにより徐々に含有割合が変化するという意味で, この場合の「連続」はもちろん数学的な意味ではありません。)

これまでどの検定手法を選ぶかでいろいろと本を参考にはしたのですが,どのような場合に「検定」そのものが出来ないかを考えたことがなかったので,もう少し勉強したいと思います。

ありがとうございました。

No.06928 Re: 生データが従属変数の場合の取り扱い  【MK】 2008/06/30(Mon) 18:05

ゾンビのように復活してきて申し訳ありません。少し考えたことがあるので,ご批判やご意見などを頂戴できれば幸いです。

まず,現時点では素材間に差がないということを帰無仮説として設定していますが,例えばそれぞれの形状(A〜D)に着目し,形状Aの含有量に差があるか,形状Bに…という風に考えるのには無理があるでしょうか。

当然AからDの含有量には従属性が残ったままではありますが,サンプル数に応じてt検定や分散分析などの手法を選択出来るのではないかと思います。

簡単にいうと,「素材XとYでは,形状AとBに有意差はあるが,CとDにはない。」ということが出来るのではないかと考えます。

検定を繰り返す多重性などの問題もあるでしょうが,とりあえず客観的に何かしら差があることを主張したいという状況にあります。

仮にこのような解析手法が用いられた場合,皆さんが審査員であればどのようなコメントをされますか。よろしくお願いいたします。

No.06929 Re: 生データが従属変数の場合の取り扱い  【青木繁伸】 2008/06/30(Mon) 19:07

> ,例えば(形状A:30%,形状B:35%,形状C:20%,形状D:15%)から(形状A:10%,形状B:15%,形状C:40%,形状D:35%)

こ のような,組成の違う素材があるということですが,たとえば形状Aが30%の素材と形状Bが10%の素材で,それぞれ30%,10%が平均値として,で は,それぞれの素材でデータはどの程度の範囲にばらついているのですか?30%±5%と10%±1%なんてことになっているなら,検定しなくても有意に違 いますよね。。。というか,そもそも別個の素材なら,検定して有意な差がないということがあってはならないのでは。ということなんですけどね。それ に,30%±5%なんていう素材は,バラツキが大きすぎるでしょう?製品としては30%±0.05%なんてことが求められたりするのでは?そんな状況な ら,更に,検定して有意な差がありますなんて結果はあたりまえなことになりますよね。

No.06930 Re: 生データが従属変数の場合の取り扱い  【MK】 2008/06/30(Mon) 22:47

青木先生

>検定しなくても有意に違いますよね(中略)そもそも別個の素材なら,検定して有意な差がないということがあってはならないのでは

確 かにおっしゃる通りです。ある程度統計をやっている場合だと当然のごとくの話なのですが,以前同じような研究をしている方が,論文投稿時に統計解析をする ようにコメントされたと聞いたので,自分でどのように対処していいか理論武装をしておこうと思った次第です。お手数をおかけして申し訳ありません。

あ と,例えば生物学の分野なんかでも,タンパク質の二次構造の含有量を見たり,あるいは鉱物学の分野でも,二つの地層から出てきた鉱物の組成の違いを見た り…などという形で,同じようなデータ構造を有する検定もあるのではないかと考えたりもしたのですが,バラツキによってはそもそもあまり検定する意味がな いんですよね。

ちょっと目的ばかり考えすぎて近視眼的になっていたような気がします。どうもありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る