No.13437 対応のあるt検定  【そろばん】 2010/09/15(Wed) 14:28

対応のあるt検定については,これまでよく質問,回答,意見もあり参考になりました。以下の場合は,やはり対応のないt検定でしょうか?
ある細胞株を特殊な条件で3日間培養します。最初にまいた細胞数が,この間増加し,また,分化しています。3日目に全ての細胞を回収し,2群に分け,薬物もしくは溶媒を処理して3日後に反応を見ます。反応は細胞表面マーカーの発現細胞数です。
こ の試験を5回繰り返します。そうすると,1回目の試験で薬物処理群の発現細胞数は,溶媒群を上回っていました。2回目は差がなく,3,4,5回目では上 回っていました。1回の試験だけでは結論が出ないので,各試験のそれぞれの群の平均値を各試験の代表値として,5回の全ての平均値を出し,薬物群と溶媒群 の比較を対応のないt検定しました。しかし,特殊な条件で培養しているため,1回から5回までの溶媒群細胞数には多いものとすくないもの間には3倍の開き があり,さらに,薬物の効果はせいぜ発現細胞数を20%増やすだけですので,薬物群と溶媒群の間には差を認めません。
このような場合,試験ごとに 細胞群は対応があるとして,対応のあるt検定でも構わないのでしょうか?それとも駄目なのでしょうか?培養の制御は結構難しく,細胞を3日目にまきなおす 時に細胞数を揃えることはできないとしてください。また,化合物が発現細胞数を明らかに増やすことは異なる種類の試験でも確かめられています。

No.13439 Re: 対応のあるt検定  【知ったかぶり】 2010/09/16(Thu) 08:47

>各試験のそれぞれの群の平均値を各試験の代表値として,

各試験ごとに反復があるということだと思いますが,平均値ではなく元のデータをそのまま使うべきでしょう.

>1回から5回までの溶媒群細胞数には多いものとすくないもの間には3倍の開きがあり,

試験によって発現細胞数の平均値が異なると考えられるのであれば,各試験をブロック因子として対応のない2元配置分散分析(薬物処理2水準,ブロック5水準)を行えば良いのでは?発現細胞数だけではなく,全細胞数が測定されているのであれば,別の解析方法もありますが.

No.13446 Re: 対応のあるt検定  【そろばん】 2010/09/16(Thu) 22:38

知ったかぶりさん,まず,ありがとうございます。

>各試験のそれぞれの群の平均値を各試験の代表値として
これは,みなさんもよく知っているJCB vol. 177 no. 1 7-11(2007)Error bars in experimental biologyの考えを採用したものです。この考えにも一理あると思っています。
1回の試験で,統計的に有意だとしても,それはそのときの平均値の差があるかどうかの検定ですので,やはり,その試験の代表値はやはり平均値かなと思っています。
>1回から5回までの溶媒群細胞数には多いものとすくないもの間には3倍の開きがあり,
ということもあるので,各群の分散がやはり異なりますので,各群の代表値は平均値ではないでしょうか?変換も考えないけないのでしょうが。

私は,やはり定性的であっても再現性を重要視しています。したがって,対応のない2元配置分散分析もやはり有意差を出すためには魅力的です。
一方,試験の再現性が,ただ単に勝つか負けるかであるというならば,5回の試験なので,5回勝ち続けると1/32の3%なので有意なのですが,これは対応のある検定をやってることと同じなのでしょうか?
1回引き分けなら,とたんに怪しくなるので,勝ち負けの方法も時間と苦労が多いのですが,頭の中ではみんな真実かどうかは,このように考えながら,自分の仮説を考えていませんか?

No.13447 Re: 対応のあるt検定  【青木繁伸】 2010/09/16(Thu) 23:29

> みなさんもよく知っているJCB vol. 177 no. 1 7-11(2007)...

分 野外なので全く知りませんが,統計の基本であるデータが何を表すかということを考えれば,10個の生データから計算された1個の平均値を使うという選択を したとたんに,サンプルサイズが1/10になるんですけど。そして,検定というものは,サンプルサイズに依存するので,10と1では大違いだと思いますけ どね。
その分野ではそれで通っているのならそれでよいでしょうけど。

No.13448 Re: 対応のあるt検定  【知ったかぶり】 2010/09/16(Thu) 23:44

>それはそのときの平均値の差があるかどうかの検定ですので,やはり,その試験の代表値はやはり平均値かなと思っています。

そういうことではなく,生データから代表値を算出する段階で,情報が捨てられてしまうので,なるべく生データをそのまま使って検定することを考えましょう,ということなんですが。

すみませんが,後半部分は何を言っておられるのか私には理解できません。

No.13449 Re: 対応のあるt検定  【青木繁伸】 2010/09/17(Fri) 10:22

> 試験の再現性が,ただ単に勝つか負けるかであるというならば,5回の試験なので,5回勝ち続けると1/32の3%なので有意なのですが,これは対応のある検定をやってることと同じなのでしょうか?

こ れは,二項検定(符号検定)ですね。確かに,五対のデータで片方がもう一方より完全に優れている(五勝ゼロ敗)なら,片側検定ではP値は1/32になり, 有意と言うことでしょう。しかし,信頼区間で見ると[0.55, 1]ということで,ほぼ五分五分のこともあり得ると言うことです(ギリギリ有意に過ぎない)。データをまとめて五対のデータにまで落とし込んだからそうい うことになるわけです。

No.13462 Re: 対応のあるt検定  【そろばん】 2010/09/20(Mon) 00:29

青木先生,知ったかぶりさん。コメントありがとうございます。
それでも,2元配置を推薦されるということは,対応のあるt検定でも良いということと理解しました。
薬物あるいは溶媒を添加する段階(0日目)から,各試験間で母集団に差があるので,認められると考えています。
考え違いでしょうか?

No.13463 Re: 対応のあるt検定  【知ったかぶり】 2010/09/20(Mon) 09:59

>それでも,2元配置を推薦されるということは,対応のあるt検定でも良いということと理解しました。

違 います.生データをそのまま使って,反復があり対応のない2元配置分散分析を行うべきです(各試験をランダム要因として一般線形混合モデルを適用するの が,より望ましいと思いますが,それはちょっと置いといて).データの構造から考えて,それが一番自然だと思います.各試験の平均値を使って検定を行うこ とにやけにこだわっていますが,何か理由があるのでしょうか?
各試験における処理区と対照区の発現細胞の総数は,対応があるデータとみなすことができるので,処理区と対照区の反復数が同じであれば,各試験の平均値を使って対応のある平均値の差の検定を行うことは間違いとは言えませんが…

No.13464 Re: 対応のあるt検定  【そろばん】 2010/09/20(Mon) 11:33

知ったかぶりさんへ
1回の試験の平均を用いて統計するJCB vol. 177 no. 1 7-11(2007)ですが,検定の仕方が,対応のないT検定としており,私の見解と異なる考えなので,どうかなと思ってだけのことです。

No.13465 Re: 対応のあるt検定  【知ったかぶり】 2010/09/20(Mon) 15:26

>1回の試験の平均を用いて統計するJCB vol. 177 no. 1 7-11(2007)ですが,検定の仕方が,対応のないT検定としており,

この論文は,グラフのエラーバーに何を示して,どう解釈するかを論議しているもので,検定方法に関する直接的な言及はありません.また,提示されている例は,mutantとwildtypeの比較など,そもそも個体が異なるものであり,対応のない検定を行うのが当然です.

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る