No.09690 複数の区間推定パワーアナリシス  【Gii】 2009/04/15(Wed) 17:16

質問です。
仕事上,細部を変更しているので,不自然かもしれませんが状況は一致していると思います。

少数の被験個体にテストを行い,その成功率を調べています。ところが今回,被験個体の処理(餌の種類など)を変更するのですが変更前と変更後で成功率が低下していないことをチェックするために,一部の被験個体について何回のテストが必要であるかが問題になっています。
被験個体が1頭の場合は「母比率の検定・区間推定のパワーアナリシス」を用いれば良いのだと思うのですが,1頭あたりのテスト回数にも限界があるのと複数個体でチェックしたいため,被験個体は2,3頭使いたいのです。
成功率にはもともと個体差があるため,全部をまとめた成功率でチェックするのもおかしい気がします。特に処理前と処理後で各個体でのテスト回数が異なると思われます。
どのように考えれば良いのでしょうか?

どなたか,ご教授を頂けないでしょうか。

No.09691 Re: 複数の区間推定パワーアナリシス  【青木繁伸】 2009/04/15(Wed) 18:26

個体差があるからこそ!被検個体が1頭であれば,処理変更前後に何回テストして成功率に差があろうと,それは「その1頭についていえること」にしかすぎません。
2頭でも3頭でも同じようなものでしょう。統計学的に,さらにいえば固有科学的には,10数頭〜数10頭必要なのでは?
それぞれの個体で,処理前後に何回テストするかはそれとは別の問題です(成功率の精度に関するものなので)

No.09694 Re: 複数の区間推定パワーアナリシス  【Gii】 2009/04/15(Wed) 19:59

すばやいご返答,ありがとうございます。
すみません。誤解を招く表現だったのか,こちらが理解し切れていないのかもしれません。

「成功率を調べています」と書きましたが,実際には集団としての成功率を求めることが目的ではありません。各個体の成功率が処理により低下しない(低下する可能性は低い)ことを調べたいのですが。
例えばA,B,C,D,Eの5頭の被検個体が50回のテストを行いそれぞれ0.3,0.4,0.5,0.6,0.7の成功率だったとします。次にこの5頭のうち何頭かに試験的に処理をし,その影響で成功率が低下するか否かを知りたいのです。
理想的には全頭について多くのテストを行うことが良いことはわかっていますが,コスト的に無理です。
処理が全個体に一定の効果を及ぼすと仮定すると,もっとも成功率の精度がでやすい?個体AかEで数多くのテストを行ったほうが良いのでしょうか?
それとも各個体のテスト回数を少なくしても全頭テストした方が良いのでしょうか?

質問が,的外れでしたらご容赦ください。

No.09696 Re: 複数の区間推定パワーアナリシス  【青木繁伸】 2009/04/15(Wed) 21:18

> 実際には集団としての成功率を求めることが目的ではありません

いろいろ言いたいことは あるとは思います。しかしですね,その処理が成功率に影響を与えるかどうかを言いたいなら,「ある1個体でこうでした」では納得を得られないのではないで すか?2個体の実験で2個体ともこうこうでした。3個体を使った実験では2個体ではこうこうこうでしたが,1個体はこうでした。同じですよね。

> 各個体の成功率が処理により低下しない(低下する可能性は低い)ことを調べたい

と いうときの,「各個体」というのは特定の個体であることは当然ながら,「そのほかの個体」も同じようですよ!といいたいのでは?(というか,そうでないな ら,一般ユーザがあなたの結果を受け入れることはできないでしょう。「うちの個体はあなたの所の個体とは違うかも知れないじゃないか」)。

符 号検定を適用するとすれば,A個体について処理前後でプラスからマイナス,B個体についてマイナスからプラス,C個体について云々。。。。。という実験を 行って,その処理がプラスマイナスいずれの作用を持つかということを検定するとすれば,サンプルサイズ(A,B,C,D,.... という個体数ですよ) は,かなり多くないと,何らかのことを言うのはむりでしょう。符号検定より検定力の強い検定を使うとか,より優れた実験計画に従ってデータを得るというこ とがなければ,ねぇ?

> 例えばA,B,C,D,Eの5頭の被検個体が50回のテストを行いそれぞれ0.3,0.4,0.5,0.6,0.7の成功率だったとします。

あ なたは,A〜Eのすべてについて検査をすることが難しいので。。。といっていますけど,もしA〜Eのすべてについて検査をすることが可能で,そのような実 験をしたとき,それぞれの成功率が,たとえば 0.4,0.3,0.4,0.2,0.8 だったとき,処理の影響があったかなかったか,どのような検定を使って結論を出したいのでしょうか?実験をどのようにするかよりも,もし,このような結果 が得られたとして,どのような解析を行うつもりかも考えておかないといけないのではないでしょうか?

No.09698 Re: 複数の区間推定パワーアナリシス  【Gii】 2009/04/15(Wed) 23:57

ご返答,ありがとうございます。
ちょっとわかってきた気がします。「テストの回数はその個体の成功率の値 の精度で,処理前後の検定を行うには個体数とは別問題」,ということですね。ただ,このような場合に各個体が持つ成功率の値の精度は考慮しなくても良いの でしょうか? 直感的には精度が悪ければ頭数が多くても検出力?は落ちる気がします。精度と頭数の関係はどう考えれば良いのでしょうか?

>たとえば 0.4,0.3,0.4,0.2,0.8 だったとき,処理の影響があったかなかったか,どのような検定を使って結論を出したいのでしょうか?
確 かに,処理による影響が各個体に対して同じようにあるという仮定自体に無理があるのかもしれません。お返事のように処理の影響で成功率が上がる個体と下が る個体が出てくる可能性もあると思います。実際には5頭とも十分なテスト回数で検査できた場合は各個体の処理前後で母比率の検定を行い,1頭でも有意に成 功率が下がっている場合は「その処理は成功率に影響を与える可能性がある」という判断で「処理」は中止または処理過程を見直すことになると思います。科学 的判断ではないのかも知れませんが…。

No.09703 Re: 複数の区間推定パワーアナリシス  【青木繁伸】 2009/04/16(Thu) 07:13

> このような場合に各個体が持つ成功率の値の精度は考慮しなくても良いのでしょうか? 直感的には精度が悪ければ頭数が多くても検出力?は落ちる気がします。精度と頭数の関係はどう考えれば良いのでしょうか?

両方必要です。しかし,どちらかというと頭数(繰り返し)を多くする必要があるでしょう。極端な場合,処理の前後で1回ずつしか測定が無くても,繰り返し数が十分(たぶん数十以上)ある方がよいでしょう。1頭で前後1万回やっても,だれも評価してくれないでしょう。

No.09706 Re: 複数の区間推定パワーアナリシス  【Gii】 2009/04/16(Thu) 09:35

アドバイスありがとうございます。テスト回数よりも頭数を重視して計画しようとは思います。ただ,数値が成功率なのでテスト回数もある程度は確保しなければならないと思います。具体的に頭数と回数を決めるのは難しい気がしますが。

No.09710 Re: 複数の区間推定パワーアナリシス  【にゃんちゅう】 2009/04/16(Thu) 12:49

>被験個体が1頭の場合は「母比率の検定・区間推定のパワーアナリシス」を用いれば良いのだと思うのですが

パワー・アナリシスで何をだしたいのですか。これって検定ではないですね。サンプルサイズを決めたいわけではないですね。

1標本研究の場合,一般にはグラフを書いただけで誰でもわかるぐらい明白な結果がでるのを期待しますね。先行研究ではどのような統計を使っているのですか?

No.09711 Re: 複数の区間推定パワーアナリシス  【Gii】 2009/04/16(Thu) 13:46

そうです。いまのところ検定ではなくサイズ(頭数とテスト回数)を決めたいのです。つまり「新規の処理によって成 功率の低下がみられない」ことを示すためには,何頭で何回テストを行えば一定の確率で低下していないと言えるのか?ということです。研究ではなく実務的な ことですので特に先行研究というものはないのですが,各個体の成功率は,F分布を用いた区間推定で95%信頼区間を出していました。

ただ,サイズが決まればテストを行い,処理前の結果と検定することになると思います。青木先生のアドバイスでは頭数とテスト回数だと,頭数を重視した方が良い
>極端な場合,処理の前後で1回ずつしか測定が無くても,繰り返し数が十分(たぶん数十以上)ある方がよい
とのことでした。
こ れは測定結果が試行結果の場合,測定回数が1回だと結果は0,1になるが,それでも頭数が多い方がよいということだと理解しても良いのでしょうか? つま り,処理の前後で100頭に1回ずつテストした方が,10頭に10回ずつテストするより良い!? でも,10頭に100回ずつテストした場合ではどうなん でしょう? またその時の検定方法は何なんでしょう? コクランのQ検定だとちょっと違うような気がします。

No.09712 Re: 複数の区間推定パワーアナリシス  【青木繁伸】 2009/04/16(Thu) 15:46

> コクランのQ検定だとちょっと違うような気がします。

条件による成功・不成功の検定だから,まさにコクランのQ検定でしょう。条件が2種。条件による成功比率は条件ごとに計算するだけ。成功比率の精度は,被験者数で稼ぐ(同じ被験者で測定回数で稼ぐ必要はない)。以下にRでシミュレーションした例を掲載
> set.seed(123)
> d <- data.frame(
+ a=sample(0:1, 100, replace=TRUE, prob=c(0.5, 0.5)),
+ b=sample(0:1, 100, replace=TRUE, prob=c(0.3, 0.6))
+ )
> sapply(d, function(x) sum(x)/length(x))
a b
0.53 0.71 # 条件ごとの成功割合
> Cochran.Q.test(d)
Statistics Q d.f. P value
6.48000000 1.00000000 0.01090950
2条件で対応のあるデータなのだから,マクネマー検定でも良いだろう。ちょっと結果は異なるが。
> xtabs(~a+b, d)
b
a 0 1
0 13 34
1 16 37
> McNemar(xtabs(~a+b, d))
n1 n2 P value
16.00000000 34.00000000 0.01534668

No.09713 Re: 複数の区間推定パワーアナリシス  【青木繁伸】 2009/04/16(Thu) 16:03

> つまり,処理の前後で100頭に1回ずつテストした方が,10頭に10回ずつテストするより良い!? でも,10頭に100回ずつテストした場合ではどうなんでしょう?

成功率は,精度が高い方がよいのは当たり前でしょう。
1頭に100回ずつやっても,「その動物の成功率」は正確に測定できますが,最初に書いたように,「他の動物でも同じことがいえるのか?」という質問には無力です。
反 復推定に適したデータ解析もあるでしょうけど(nlmeとかいうやつ?),簡単にはコクランのQ検定やマクネマー検定を適用できるようなデータを集める方 がよいでしょう。100頭に100回ずつなら,一挙両得(一石二鳥?)でしょうけど,100回ずつから得た成功率をどうやって検定に使いますか?成功率を データだと思って対応のあるt検定(あるいは符号付き順位和検定)をするのですか?

No.09715 Re: 複数の区間推定パワーアナリシス  【sb】 2009/04/16(Thu) 16:13

> 両方必要です。しかし,どちらかというと頭数(繰り返し)を多くする必要があるでしょう。

青木先生の指摘に尽きると思います。

バ ラツキの大きい測定値(例えば,血圧等)の場合,何度か測定して平均値を用いる方が,1回切りの測定値を使用するよりも,関連が強く出ることが知られてい ます(dilution phenomenonと云うのだったか?よく覚えていない)。しかし,その効果は限定的で同じ手間暇,資金を投下するのであれば,頭数を増やすことに使う べきです。

また,同一検体からの繰り返し測定は結構ですが,得られる測定値は独立ではありませんので,それに相応しい解析 (multilevel modellingと云うことになるのか?判らないけど)が,必要となります。つまり,方向性としては,間違いではないにしろ,労多くして,益少なしとな る可能性が大きいと思います。

No.09716 Re: 複数の区間推定パワーアナリシス  【Gii】 2009/04/16(Thu) 16:27

例を出していただき,ありがとうございます。
例示していただいたのは,処理の前後で100頭に1回ずつテストした結果だと理解しています。
ご指摘の通り,一番悩んでいるのは10頭に10回ずつテストする場合の検定方法についてです。その場合は一般的?な検定方法は適用できないのでしょうか?

No.09719 Re: 複数の区間推定パワーアナリシス  【sb】 2009/04/17(Fri) 09:03

> 10頭に10回ずつテストする場合の検定方法についてです。

非線形混合モデル(分野に よっては,階層モデルと呼ばれる)で解析可能と思います。Rでは,青木先生が挙げられているnlme(non linear mixed effect model)です。混合モデルでは,個体間の変動と共に個体内変動もモデル化します。Giiさんの主張は,混合モデルのパラダイムで云えば,個体間変動 (普通は,こちらのみを取り扱う)だけでなく,個体内変動も考慮すべきでないかと解釈できます。そして,それは全く正しいと思います。

非線形混合モデルは,分散分析を拡張・洗練したバージョンと考えられます。分散分析の基本概念の理解に加えて,,線形回帰分析,非線形回帰分析の知識が必要となります。

No.09720 Re: 複数の区間推定パワーアナリシス  【Gii】 2009/04/17(Fri) 12:24

青木先生,sbさん,多くのアドバイスをありがとうございます。
nlmeは敷居が高そうですが,できる範囲で勉強してみようと思います。
色々と統計的な考え方についても学ぶことができました。企業だと現実的な制約が多く,難しい面もありますができるだけ頑張ってみようと思います。ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る