★ どこまでが対応ありでしょうか ★
315 どこまでが対応ありでしょうか Tanaka 2001/11/27 (火) 15:15
333 Re: どこまでが対応ありでしょうか sb812109 2001/11/28 (水) 23:52
345 Re^2: どこまでが対応ありでしょうか Tanaka 2001/11/29 (木) 22:35
346 Re^3: どこまでが対応ありでしょうか sb812109 2001/11/29 (木) 23:21
366 Re^4: どこまでが対応ありでしょうか Tanaka 2001/12/01 (土) 22:57
367 Re^5: どこまでが対応ありでしょうか sb812109 2001/12/02 (日) 00:18
373 Re^6: どこまでが対応ありでしょうか Tanaka 2001/12/02 (日) 22:42
372 Re^6: どこまでが対応ありでしょうか Tanaka 2001/12/02 (日) 21:06
374 Re^7: どこまでが対応ありでしょうか sb812109 2001/12/03 (月) 00:29
377 Re^8: どこまでが対応ありでしょうか Tanaka 2001/12/03 (月) 12:33
376 Re^8: どこまでが対応ありでしょうか Tanaka 2001/12/03 (月) 12:05
382 Re^9: どこまでが対応ありでしょうか sb812109 2001/12/04 (火) 00:27
385 Re^10: どこまでが対応ありでしょうか Tanaka 2001/12/04 (火) 17:32
386 Re^11: どこまでが対応ありでしょうか sb812109 2001/12/05 (水) 00:29
387 Re^12: どこまでが対応ありでしょうか Tanaka 2001/12/05 (水) 12:01
394 Re^13: どこまでが対応ありでしょうか sb812109 2001/12/06 (木) 00:33
397 Re^14: どこまでが対応ありでしょうか Tanaka 2001/12/06 (木) 11:51
315. どこまでが対応ありでしょうか Tanaka 2001/11/27 (火) 15:15 |
|
初めて投稿させていただきます。
以前にも似たような質問が掲示板にありましたが、私の抱えているケースが同じかどうか分からなかったもので、質問させていただきます。
37枚の組織標本について、標本毎に「陽性細胞」の割合(%)を
次の3つの方法で計測しました。
(A)目測 (B)コンピューター解析法1 (C)コンピューター解析法2
そして、(B)(C)については、日を変えて3回、計測を繰り返しました。
統計処理したいのは、次の二つです。
(1)3つの測定法で、値に違いがあるのか
(2)(B)(C)は、日によって差が生じるのか
(2)はOne-way repeated measures ANOVAでいいとして
(1)は測定法の違いを、(2)同様に単に条件の違いとみなして
One-way repeated measures ANOVAでいいのか、
それとも対応がないものとして、One-way factorial ANOVAを使うべきなのか
わかりません。
どうぞよろしくお願いいたします。 |
[このページのトップへ]
333. Re: どこまでが対応ありでしょうか sb812109 2001/11/28 (水) 23:52 |
|
> それとも対応がないものとして、One-way factorial ANOVAを使うべきなのか
> わかりません。
同じ標本を3つの手法で評価するわけですから、対応があるのではないでしょうか。 |
[このページのトップへ]
345. Re^2: どこまでが対応ありでしょうか Tanaka 2001/11/29 (木) 22:35 |
|
> 同じ標本を3つの手法で評価するわけですから、対応があるのではないでしょうか。
お答え、どうもありがとうございました。
一人で考えれば考えるほど、訳がわからなくなっていたところで
非常に助かりました。 |
[このページのトップへ]
346. Re^3: どこまでが対応ありでしょうか sb812109 2001/11/29 (木) 23:21 |
|
質問からははっきりしませんが、3種類の測定に差があるとの感触でしょうか?
臨床の立場から云えば、たとえ3種類の測定値に差がないと結果が出た場合で
も、ばらつきがどの程度あるのかを具体的に示して貰った方が、実用的だと思
います。以前この掲示板で紹介しましたAltmanの論文は、非常に素朴な手法を
用いて、特別に統計学の知識が無くても、直観的に判り易い説明をしています。
データも掲載されており、追試も簡単ですし、2ページ程度の短い論文ですので
一読をお薦めします。 |
[このページのトップへ]
366. Re^4: どこまでが対応ありでしょうか Tanaka 2001/12/01 (土) 22:57 |
|
> 質問からははっきりしませんが、3種類の測定に差があるとの感触でしょうか?
はい,(B)コンピューター解析法1が,(A)目測と食い違うことが少なからずあるため,(C)の方法を開発し,目測とほとんど同じ値がでるようになりました.
で,統計処理すると(B)が思ったより差がないということになりました.差がないというのが,どうも印象と違ったため,この掲示板で質問させていただきました.
以前は対応なしのOne-way ANOVAを使っていたのですが,対応ありのANOVAやってみます.
> Altmanの論文は、(中略)一読をお薦めします。
PubMedで検索したのですが,お薦めの1989年の論文が見つかりません.
似たような論文で
"Estimating with confidence."
Br Med J (Clin Res Ed). 1988 Apr 30;296(6631):1210-1.
というのがありましたが,もしこの論文でないなら,大変お手数ですが,
再度,雑誌名に加え,巻と頁をお教え願えますでしょうか. |
[このページのトップへ]
367. Re^5: どこまでが対応ありでしょうか sb812109 2001/12/02 (日) 00:18 |
|
> で,統計処理すると(B)が思ったより差がないということになりました.
> 差がないというのが,どうも印象と違ったため,この掲示板で質問させ
> ていただきました.
思ったより差がないと云う点が重要だと思います。まず、差がどの程度あれ
ば臨床的に問題となるかを決めるのが最初です。そして、その差をα過誤が
0.05、検出力が80%になるのに必要なサンプル・サイズを決定し、測定を行い
ます。サンプル・サイズはどの程度ですか?
基本的に統計は、帰無仮説を棄却することを目的とします。帰無仮説が棄却
されないことを以って有意差無し==差がないと結論付けることには、躊躇い
を感じます。この種の実験では、手抜きをして、サンプル・サイズを小さめ
にすれば、容易に有意差無しとの結論に到ってしまいます。統計手法よりも
データ収集法がより重要な問題と考えます。
Altmanの論文:
Statistical Methods for Assessing Agreement Between Two Methods of
Clinical Measurement. The Lancet, February 8,1986
|
[このページのトップへ]
373. Re^6: どこまでが対応ありでしょうか Tanaka 2001/12/02 (日) 22:42 |
|
特に、今回は(A)目測と(B)コンピューター解析法1が有意差があるだけではなく、
できれば(A)と(C)解析法2が有意差がないということも言いたいので、
十分なサンプル数で、きちんとした検出力の元で、やはり差がなかったと
論じなければ、いけないわけですよね。 |
[このページのトップへ]
372. Re^6: どこまでが対応ありでしょうか Tanaka 2001/12/02 (日) 21:06 |
|
ご指摘のとおり,検出力は念頭においていませんでした.
主に稀な腫瘍を扱っておりまして,従来はサンプルサイズに関しては
集められるものすべてというやり方がほとんどでした.
今後は,可能なら検出力に基づいてサンプルサイズを決め,
どうしても集まりにくいものに関して,統計処理をする場合は,
検出力も念頭におきながら,discussionを進めていこうと思います.
(従来も,「有意差がない=差がない」ではなく,(種々の理由で)「差が検出できなかった」ものと考え,それなりのdiscussionは加えていたのですが)
参考までに,サンプルサイズを書いておきますと,
先に37枚の標本と書きましたが,実は二種類の腫瘍からなっています.
一つは12サンプルで,目測での結果が,2.1 +/- 1.1%(mean +/- SD)です.2%を境に予後に差が出るとの論文がありますので,2%の差が検出できればと思っています.もう一つは,25サンプル,9.0 +/- 6.1%です.
三群の平均値の差の検定の場合,α=0.05とすると,
二群の平均値の差で,検出力の計算式で,αを1/3にすればよいのでしょうか.
それとも,別の計算式があるのでしょうか. |
[このページのトップへ]
374. Re^7: どこまでが対応ありでしょうか sb812109 2001/12/03 (月) 00:29 |
|
> 主に稀な腫瘍を扱っておりまして
ちょっと誤解していました。機器の評価が主題でサンプル・サイズは自
由に設定出来るものと思っていました。
> 三群の平均値の差の検定の場合、
以下のような方針をとっています。
(1)名義変数(自然の順序がない)場合
1つを基準にとり、他の群との比較をα=0.05で行う。
(2)名義変数でない(自然の順序がある)場合
1つを基準にとり、他の群との比較をα=0.05で行う。
順序を考慮(その分野の常識に基づく)に入れ、統計学的有意差
を意味のあるものか否かを判断する。必要であれば、trend検定
を行う。
訊ねられれば多重比較を!と言います。ただ私だったら、目測vs.機械1、
目測vs.機械2を独立にα=0.05で検定を行います。ただし怒られても知
らない。
> 十分なサンプル数で、きちんとした検出力の元で、やはり差がなかったと
> 論じなければ、いけないわけですよね。
統計学は不完全な背理法だとどっかで読んだような、、、。
もしそうだとすると、差がないと主張するにはあまり適した方法論ではない
でしょう。Altmanの素朴な方法論を支持する理由です。
|
[このページのトップへ]
377. Re^8: どこまでが対応ありでしょうか Tanaka 2001/12/03 (月) 12:33 |
|
> Altmanの素朴な方法論を支持する理由です。
早速,ざっとですが,論文を読みました.二つの測定法の平均が真の値のbest estimateというのは目からうろこが落ちる思いでした.是非とも論文に取り入れたいと思いますが,どうすれば"The degree of agreement"がacceptableとしていいかが分かりにくかったので,もう少ししっかり読みたいと思います.
そして,個人的な御意見をお伺いしたいのですが,この方法で評価すれば,先生は他の統計手法は一切論文に加える必要がないとお考えでしょうか.それとも,一応,従来良く使われている相関(や有意差)は併記しておいても,(主に見慣れた手法は感覚として分かりやすいという意味でですが)意味があるとお考えでしょうか.
|
[このページのトップへ]
376. Re^8: どこまでが対応ありでしょうか Tanaka 2001/12/03 (月) 12:05 |
|
> 機器の評価が主題でサンプル・サイズは自由に設定出来るものと思っていました。
説明不足で,大変申し訳ありません.
もちろん,主題は機械の評価なのですが,この陽性細胞を計測するという方法は原発性脳腫瘍で盛んに行われています.この評価法は,胃癌や肺癌のように頻度の高い腫瘍や他の染色法の評価にも応用が十分可能と考えていますが,今のところ胃癌や肺癌では,原発性脳腫瘍と比較して,「この陽性細胞を計測してもあまり意味がない」ようです.それなので,サンプルが得られにくいのを承知で,まずは原発性脳腫瘍で行っています.
> 目測vs.機械1、目測vs.機械2を独立にα=0.05で検定を行います。
ご指摘のとおり,問題はいかに目測に近いかということを示すことであると考えていますので,あえて三群を立てる必要はなかったですね.根本的なことに気が付かず,お恥ずかしい次第です. |
[このページのトップへ]
382. Re^9: どこまでが対応ありでしょうか sb812109 2001/12/04 (火) 00:27 |
|
> 一応,従来良く使われている相関(や有意差)は併記しておいても,(主に見慣
> れた手法は感覚として分かりやすいという意味でですが)意味があるとお考えで
> しょうか.
(1)相関係数およびFig.1:棄却
理由)2つの測定法の一致度を評価するする指標としては、相関係数は不適
切であるとAltmanは主張しています。Altmanの主張が合理的であると
考えるなら、これらは載せるべきではないと思います。
(2)2つの測定の平均値の差に関する検定およびFig.2:採択
理由)Fig.2はこの論文の眼目です。2つの測定法に全体として、どの程度、
差があるのか、その差は統計学的に有意な差なのか、また、偶然誤差
はどの程度なのか、全ての情報がFig.2に表現されています。
|
[このページのトップへ]
385. Re^10: どこまでが対応ありでしょうか Tanaka 2001/12/04 (火) 17:32 |
|
Altmanの論文,丸一日かけて通読してみました.
(いまだにlog変換の部分と繰り返し測定は自信がありませんが)
素人でも「なるほど」と思う部分が多い,読み応えのある論文でした.
それで,英文は苦手ではないのですが,統計は得意ではないので,少し確認させてください.
(1)Fig2(PEFR)がnot acceptableなのは,プロットしたうちの一つ(1/17=5.9%)がmean +/- 2SDから外れているからなのでしょうか.それとも差のmean +/- 2SDの標準誤差を考えてみると,+/-で100 l/minを越えてしまうので,最初の方で述べている「100 l/minの違いは・・・」という点からnot acceptableなのでしょうか.それとも両方なのでしょうか.
(2)実際に使う場合は,まず二つの測定法の違いの許容範囲を決める.そして可能ならサンプルサイズは「二つの平均の差の検定の場合の検出力に基づく式」から算出し,決定してから使うということでよろしいですか. |
[このページのトップへ]
386. Re^11: どこまでが対応ありでしょうか sb812109 2001/12/05 (水) 00:29 |
|
> (1)Fig2(PEFR)がnot acceptableなのは,(中略)
> 2SDから外れているからなのでしょうか.
違います。
2つの測定値の差が正規分布をすると仮定します。そ
して、もし、100回測定をした場合、95回が収まる範囲
が-79.7〜75.5l/minであるとの結果です。そして、こ
の、75〜80l/minの違いが臨床的にnot acceptableと
云っているわけです。どの程度差があれば、臨床的に
問題なのかは論文に明示してはありませんが、75〜80
は臨床的に問題ありとの結論です。
> (2)実際に使う場合は,まず二つの測定法の違いの許
> 容範囲を決める(後略)
その通りだと思います。
Ideally, it (measurement error) should be defined
IN ADVANCE to help in the interpretation of the
method comparison and to choose the sample size.
とあります。 |
[このページのトップへ]
387. Re^12: どこまでが対応ありでしょうか Tanaka 2001/12/05 (水) 12:01 |
|
非常に明快な解説ありがとうございました.
頭の中がすっきりとしました.
プロットされた点ばかりに目がいって,mean +/- 2SDという範囲が重要であるというのが,読みきれてませんでした.
そうすると,Precision of estimated limits of agreementのところは,
standard errorを考慮すると,agreementの上限が40.9-110.1,下限が-45.1〜-114.3を取りうるので,最も狭い範囲で考えても(optimistic),-45.1〜40.9となるので,40も違えばnot acceptableということなんですね.
もう一つだけ確認させてください.
standard errorを考慮するのは,例えばサンプル数が少ないとか,ばらつきが大きいなどの場合でよいのでしょうか.
(We MIGHT sometimes wish to use standard error...とありますし,Fig3では,the limit of agreementのstandard errorは考慮されずにcan be used in placeとしているようなので,必須ではないような印象を受けたのですが) |
[このページのトップへ]
394. Re^13: どこまでが対応ありでしょうか sb812109 2001/12/06 (木) 00:33 |
|
前半OKです。
系統誤差(systematic error / bias)と偶然誤差(random error / バラツキ)
とが混乱しているような印象を受けます。前回までは、2つの測定値の差の分布
つまり偶然誤差の話であり、standard deviationで評価します。今回の話は、2
つの測定の”平均値”の差、系統誤差の話であり、standard errorで評価します。
前回は、偶然誤差(データが如何にバラツイテあるいは密集しているか)の話で
今回は、2つの測定値の”重心”がどの程度離れて(あるいは近接して)いるか
の話です。
Fig2: 系統誤差は統計学的に有意ではない、しかし、偶然誤差は大きい。
Fig3: 系統誤差は統計学的に有意である、 しかし、偶然誤差は小さい。
論文では、Fig2の偶然誤差は臨床的に容認できないと判断し、not acceptableと
の結論です。Fig3の系統誤差は統計学的には有意であっても臨床的にはとるに足
りず、偶然誤差は臨床的に許容範囲との判断でacceptableとの結論のようです。
|
[このページのトップへ]
397. Re^14: どこまでが対応ありでしょうか Tanaka 2001/12/06 (木) 11:51 |
|
丁寧な解説ありがとうございました.
正直なところ,今までは,自分のデータを元にやってみたものの,どう評価していいのか分からないところが多かったのですが,ようやく自分のものになった気がします.
つまり,(すべて95%で考えています)
Fig2では,差の平均が-22から17.8まで取りうるので,差が0になる可能性もあって,有意な差はないと考えてもいいかもしれないけれども,100回測定したら,95回は40以上も差が出るので,そんなに違うんじゃ臨床的には一致しているとはいえないということなんですね.
逆にFig3では,差(OSM-POS)の平均が0.13〜0.7で,どうしてもPOSの方が有意に小さな値が出てしまうけれども,その差は2,3%で収まってしまうので,仮に本当の飽和度が80%であっても78%や82%ぐらいで値を出してくれるなら,臨床的にはほとんど問題なく,一致しているといっていいでしょうということなんですね.
こうして考えると,同じ一つのグラフでも,単に相関のグラフと比べて全然情報量が違いますね. |
[このページのトップへ]
● 「統計学関連なんでもあり」の過去ログ--- 016 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る