No.12996 Re: ゼロ値と整数値での統計は 【青木繁伸】 2010/07/07(Wed) 17:03
「t 検定」のように,小文字で書くのが慣例です。「統計をかける」といういい方も,特異です。
それはさておき,
> 一方の群でゼロである場合には通常のT検定には持ち込めないようで
そんなことはありません。
添付図に示すように,Excel でも,R でも,JMP でも,同じ結果になりますよ。
たぶん,SPSS も同じでしょう(同じでない方が異常でしょう)。
図をクリックして拡大してください。
No.12998 Re: ゼロ値と整数値での統計は 【ひの】 2010/07/07(Wed) 17:36
データの詳細がよくわかりませんが,そもそもt検定は不適当なのでは?
比率の差の検定じゃないのかな。
No.13001 Re: ゼロ値と整数値での統計は 【青木繁伸】 2010/07/07(Wed) 18:42
このようなデータは,観察単位がなんなのか不明確で困りますね。
n = 10 と書かれたのは,例えばシャーレが 10 個で,それぞれのシャーレには細胞がいっぱい(1000 ほど?)あって,そのうちの 2, 3 個が陽性細胞というのでしょうか?
つまり,
A 群 0/1000, 0/1000, ... のように 10 個全部 0/10000
B 群 2/1000, 3/1000, 0/1000, 1/1000, ... のようなものが 10 個
分母は,シャーレごとに異なるのでしょうか。ちゃんと数えられているのでしょうか?
発現細胞数/全細胞数 を評価値として,評価値 10 個ずつの二群の平均値の差の検定を行うということかな?
それがよいかどうかは別として,先行研究ではどのように扱っていますか。
比率の差の検定ということになると,群ごとに 10 個のシャーレの陽性細胞数と全細胞数を合計して
総陽性細胞 全細胞数合計
A群
B群
のような2×2分割表にして,この場合はたぶん Fisher の正確検定。
シャーレの細胞数を合計してよいかというのがちょっと気になる?
No.13002 回答ありがとうございます。 【小野】 2010/07/07(Wed) 20:00
青木先生,ひの様,ありがとうございます。大変参考になります。t検定ですね。気をつけます。
添付の図を参考にSPSSでやってみたところ,t検定できました(等分散を仮定しないという条件で有意差があるようです)。Prismではエラーとなってしまったので,できないものかと思いこんでました。
観察単位について不明確ということですので,追加させていただきます。
具 体的に言いますとマウスのある組織を横断面で切片とし,核染色を行ったうえで,アポトーシス検出のためのTUNEL染色を行い,陽性細胞数をカウントしま す。陽性細胞数は少ないのですが,薬剤処置により増加します。そこで正常群と処置群でアポトーシスが増加するかどうかを比較検定することになります。全核 数は断面ごとに異なりますので,ある一定の範囲内の核数をカウントしたうえ,その範囲の陽性細胞数をカウントし,一般的には全核数5000に補正した場合 の陽性細胞数をその群の度数とし,それを比較するという流れになります。
先行研究では正常群においてもわずかながらに陽性細胞を認めるた め,0以上の数値となり,処置群との比較にt検定を用いていました。ところが今回私が行った実験では正常群に範囲内では見当たらないため(当然範囲を広げ て検索する必要性があるという指摘はあります),そうなるといくら全核数をカウントしても度数は0になるわけです。
正常群の切片を10枚見てもやはりいずれも陽性核数が0なので,それはt検定はできないのでは,という同僚の指摘があり,さらにprismでエラーが出たため,できないものだと思い,御相談させていただきました。
ひの様より比率の差の検定というご指摘も頂いたのですが,それについてどのようなものかよくわからなかったものについても,具体的にご説明いただきありがとうございます。
追記させていただきました。
No.13003 Re: ゼロ値と整数値での統計は 【青木繁伸】 2010/07/07(Wed) 21:15
> ある一定の範囲内の核数をカウントしたうえ,その範囲の陽性細胞数をカウントし,一般的には全核数5000に補正した場合の陽性細胞数をその群の度数
このようなのは非常に扱いづらい状況を作り出しますね。
陽 性細胞のある範囲をサンプリングの対象にしてしまいがち(目をつぶって範囲を決めるとか,前もって範囲を書いたテンプレートをかぶせて範囲内の細胞を数え るとかすればよいが)。また,実際に数える細胞数がほぼ同じであればよいけど,なんらかの原因で数が違うと重み(倍数)がことなる。それに,実際に数えた 数でないため,ニセのサンプルサイズの問題が生じる。比率の差の検定でやろうとした場合,全細胞数5000に補正したときと10000に補正したときで差 が生じる(本当は補正しないで,実際に数えた数を使うべき)。t検定する場合には陽性細胞の比率の数値を使うので,補正しようがしまいが同じ。
> prismでエラーが出たため
ちなみに,どのようなエラーが出たのかエラーメッセージを教えて頂ければと。
No.13004 Re: ゼロ値と整数値での統計は 【小野】 2010/07/07(Wed) 22:07
青木先生ありがとうございます。ご指摘もっともです。全細胞数については重ならないように顕微鏡下で20視野ほど 写真をとって核数をImageJという画像解析ソフトでカウントしています。その中の陽性細胞数をカウントする,という数え方です。補正しない方が絶対数 となるのでよいのでしょうが,データの見た目ということで補正しているのだと思っていました。全核数については大きく異なることはないようです。
Graph Pad Prism ver5ではA群がすべて0,B群がランダムな数値でUnpaired Tを行うと次のようなエラーが出ました。
T test: Commentary
Table analyzed:Data 1
All the values in one of the columns are identical. Cannot calculate unpaired t test.
ただ,たとえばA群がすべて1でも同じようなエラーが出るので,0に限った問題ではなく,偏ったデータであったことが問題のようでした。
No.13005 Re: ゼロ値と整数値での統計は 【青木繁伸】 2010/07/07(Wed) 23:57
http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html
に 示している検定方式(数式)を見ればわかるように,片方の群で総てのデータが同じ値の場合,片方の不偏分散(変動)が 0 になりますが,計算上不都合はありません。そのようなデータにおいて t 検定を実施するのが適切かどうかは判断の分かれるところでしょう。しかし,全く同じ値ではないがきわめて近い値,従って,不偏分散(変動)がどの程度 0 に近い値になる。そのような場合にも,どの程度 0 に近ければ検定が不適切かという基準は決めがたい(実際そのようなものは聞いたことがない)でしょう。従って,値が同じ場合のみを特別扱いしてエラーメッ セージを出して検定を行わないというのは不適切な判断だと思います。
No.13009 ありがとうございます 【小野】 2010/07/08(Thu) 02:45
青木先生,ありがとうございます。ご指摘のようにU値が0であってもかまわないということですね。大変よくわかりました。
● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る