No.22802 どのような統計をつかうのでしょうか  【こういち】 2019/08/18(Sun) 03:28

青木先生
以下の疑問に関して教えてください

「疾患A型の患者」および「疾患B型の患者」における 左室形態(4つタイプがありNormal, concentric remodeling(CR), concentric hypertrophy(CH), eccentric hypertrophy(EH))の分布を明らかにしました。結果の全体像は表1のようになりました。

ここで私が示したいことはA型ではCRが有意に多く,B型ではCHが有意に多い,
ということです。

そのために私がどのようにしたかというと
表2,表3のような2x2表をつくって(この作り方が正しいのか疑問ですが)
Fisher法で計算をしてそれぞれp=0.0427, p=0.0378という結果を得ました。
まず質問はこの統計処理が正しいのかを教えてください。

次にこれがもし正しいとしたら,下位比較をするという意味で,たとえば有意水準をBonferroniによって0.05/4C2=0.0083以下,とするのでしょうか?

別の考え方として4x2のクロス集計をおこなってP=0.1169を得たとして,
有意差なしでA型とB型の左室の型の分布に差がなし,で終了でしょうか?

以上,教えてください
よろしくお願いいたします


No.22803 Re: どのような統計をつかうのでしょうか  【青木繁伸】 2019/08/19(Mon) 10:11

最初から CR,CH 型の比較だけを行うと決めていたのなら,(CR, CH)×(A,B) の 2×2 分割表の検定をすればよいのですが,今回はそうではなさそうなので,全ての組み合わせでの 2×2 分割表の検定をしてボンフェローニ法を適用する。(CR, CR 以外)×(A,B),(CH, CH以外)×(A,B)などとするのではないので注意。つまり,NormalとCR, NormalとCH,NormalとEH, CRとCH,CRとEH,CHとEH の 6 通りの比較を行う。
なお,「全体で有意である場合に下位検定として行える」という条件が必要かどうかは諸説ありますが,「この条件は不要」との見解が優勢かもしれない。

Fisher の正確検定でなければ,http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/Pmul-Tukey.html に書いてある方法を使えるでしょう(http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/Pmul-Ryan.html でもよいが,前者の法が通りがよいかな?)。

No.22804 Re: どのような統計をつかうのでしょうか  【こういち】 2019/08/20(Tue) 00:56

青木先生

お返事をいただきありがとうございました。
responseが遅くなりお詫び申し上げます。
先生からいただいた説明を何度も何度も読み直してみましたが
私の説明が悪くて質問の意図が伝えられていないと思いました

私の疑問は
「たとえばA型という疾患においてCR, CH型の頻度を比較をする」ということではなく
「4 つある形態の一つであるCRという形態を呈する患者が,A型では全体の56%, B型では全体の38%で,これらを比較するときに,どの様な統計を用いれば,CRという形態はA型がB型よりも有意に多いことを示せるか?」というA型と B型の比較のための統計処理がわからない,ということです。

そして同様に上記と独立して,
「4つある形態の一つであるCHという 形態を呈する患者が,A型では全体の34%, B型では全体の52%で,これらを比較するときに,どの様な統計を用いれば,CHという形態はB型がA型よりも有意に多いことを示せるか?」というA型と B型の比較ののための統計処理がわからない,ということです。

私のいっている比較そのものがそもそも統計処理にそぐわず,有意に多い,ことは示せないのでしょうか?。
基本的なことが分かっていないとんちんかんな質問かもしれないと,
だんだん心配になってきましたが,どうか教えていただければ,本当にありがたいです。
よろしくお願いいたします。

No.22805 Re: どのような統計をつかうのでしょうか  【青木繁伸】 2019/08/20(Tue) 08:28

No. 22802
> 私が示したいことはA型ではCRが有意に多く,B型ではCHが有意に多い,ということです。



No. 22804
> 「たとえばA型という疾患においてCR, CH型の頻度を比較をする」ということではなく...CRという形態はA型がB型よりも有意に多いことを示せるか

相 反する説明がありますが。まあ,それは行方向のパーセントと列方向のパーセントのどちらを評価対象にするかということで,どちらが原因で,どちらが結果な のかで自ずと決まるものですが。でも,chisq.test でも,Fisher.test でも行・列の違いは無視されます(結果は同じ)。

> 「4つある形態の一つであるCRという形態を呈する患者が,A型では全体の56%, B型では全体の38%で,これらを比較するときに,どの様な統計を用いれば,CRという形態はA型がB型よりも有意に多いことを示せるか?」というA型と B型の比較のための統計処理

ならば,二項検定でよいでしょう。これだと,行ごとの検定になります。CR が A:66, B:19 で帰無仮説では母比率=0.5
> binom.test(66, 85)

Exact binomial test

data: 66 and 85
number of successes = 66, number of trials = 85, p-value = 3.041e-07
同様に CH では

> binom.test(40,66)

Exact binomial test

data: 40 and 66
number of successes = 40, number of trials = 66, p-value = 0.1089
ただし,この二つの検定は独立ではないです(独立性の検定という意味ではない)。
CR の 66 も 29 も Normal, CH, EH の度数による制約があります。

(Normal,CR,CH,EH)x(A,B) はそれらの制約のもと,Normal, CR, CH, H それぞれで,A, B の割合に違いがあるかを検定するものですよね。
検定ファミリーの一つに (CR,CH)x(A,B) があり,それは,CR, CH で A, B の割合に違いがあるかを検定する。
> fisher.test(matrix(c(66, 40, 19, 26), 2))

Fisher's Exact Test for Count Data

data: matrix(c(66, 40, 19, 26), 2)
p-value = 0.03111
CR では A,CH では B が有意に多い(A では CR,B では CH が有意に多い)といえるわけでしょう。

なお,また最初に戻りますが,「A型ではCRが有意に多く,B型ではCHが有意に多い」ということなら,A, B ごとに一様性の検定
> chisq.test(c(7, 66, 40, 5))

Chi-squared test for given probabilities

data: c(7, 66, 40, 5)
X-squared = 86.407, df = 3, p-value < 2.2e-16

> chisq.test(c(2, 19, 26, 3))

Chi-squared test for given probabilities

data: c(2, 19, 26, 3)
X-squared = 34, df = 3, p-value = 1.981e-07
でも,これはこの場合は Normal と EH がCR, CH より格段に少ないことが原因。
> binom.test(66, 106)

Exact binomial test

data: 66 and 106
number of successes = 66, number of trials = 106, p-value = 0.01478

> binom.test(19, 45)

Exact binomial test

data: 19 and 45
number of successes = 19, number of trials = 45, p-value = 0.3713
こんないろいろなことを考えなきゃいけないけど (CR,CH)x(A,B) でやればよいのでは?

No.22806 Re: どのような統計をつかうのでしょうか  【こういち】 2019/08/21(Wed) 21:43

青木先生

丁寧に教えていただきまして,本当にありがとうございます。
教えていただいたことが恐らくは十分に理解されていないと思いますので
時間をかけて考えてみようと思います。

最後にひとつだけ教えてください,
先生が薦めてくださる「(CR, CH)x(A, B)をやる」,というのは
下のような2x2の表を作成してp=0.0311を求め,
(この表の作り方が正しいのかわかりません)
この場合「A型ではCRが多く,B型ではCHが多い」
(←この言い方が正しいかどうかにも自信がありません)ことが
0.0311>0.008(=0.05/6)であり有意とは言えない

という理解でよろしいでしょうか?
最後に教えていただければ本当にありがたいです


No.22807 Re: どのような統計をつかうのでしょうか  【青木繁伸】 2019/08/22(Thu) 08:13

> A型ではCRが多く,B型ではCHが多い
> 0.0311>0.008(=0.05/6)であり有意とは言えない

でよいと思います。

No.22811 Re: どのような統計をつかうのでしょうか  【こういち】 2019/08/22(Thu) 18:18

青木先生

お忙しい中いろいろ教えていただき
本当にありがとうございました
また,よろしくお願いいたします

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る