★ P-value の計算の仕方 ★

3995. P-value の計算の仕方 吉田 2004/08/20 (金) 18:50
├4005. Re: P-value の計算の仕方 吉田 2004/08/22 (日) 18:28
│├4008. Re^2: P-value の計算の仕方 青木繁伸 2004/08/22 (日) 20:10
││└4030. Re^3: P-value の計算の仕方 まこまこ 2004/08/24 (火) 21:48
││ └4031. Re^4: P-value の計算の仕方 青木繁伸 2004/08/24 (火) 22:06
││  ├4060. Re^5: P-value の計算の仕方 吉田 2004/08/25 (水) 21:39
││  └4057. Re^5: P-value の計算の仕方 まこまこ 2004/08/25 (水) 19:25
│├4007. Re^2: P-value の計算の仕方 青木繁伸 2004/08/22 (日) 19:59
│└4006. Re^2: P-value の計算の仕方 青木繁伸 2004/08/22 (日) 19:55
├4003. Re: P-value の計算の仕方 青木繁伸 2004/08/21 (土) 23:16
│└4009. Re^2: P-value の計算の仕方 さら 2004/08/23 (月) 07:01
│ └4011. Re^3: P-value の計算の仕方 青木繁伸 2004/08/23 (月) 07:51
│  └4018. Re^4: P-value の計算の仕方 さら 2004/08/23 (月) 23:05
└3997. Re: P-value の計算の仕方 さら 2004/08/20 (金) 23:27


3995. P-value の計算の仕方 吉田  2004/08/20 (金) 18:50
吉田といいます。
遺伝子の研究しています。統計学が良く分からずに困っております。
P-valueの出し方について,教えて下さい。
例1
素因子が7271あり,その中でカテゴリーAに属するものが15あります。
ある実験の結果,有意に変化した素因子が636あり,その中にはカテゴリーAに属するものが10個含まれていました。
この時に,この実験条件にはカテゴリーAが有意に関与している事を示すP-valueをどのように計算したら良いかを教えて下さい。
例2
 例1と似ていますが,素因子が7271あり,その中でカテゴリーAに属するものが15あります。
ある実験の結果,有意に変化した素因子が370あり,その中にはカテゴリーAに属するものが5個含まれていました。
この時に,この実験条件にはカテゴリーAが有意に関与している事を示すP-valueをどのように計算したら良いかを教えて下さい。

     [このページのトップへ]


4005. Re: P-value の計算の仕方 吉田  2004/08/22 (日) 18:28
さら様 青木様 
どうも有り難うございました。
基礎が無いせいか,意味が良く分かりません。
表の分け方は解りますが,
「Fisher's Exact Test によるとオッズ比の95%信頼区間が (6.56, 79.09)になります。」という意味が全く分かりません。
「そのようなデータの解析(検定)については,先行研究の論文を見ればわかることでしょう。」というご指摘ですが,初心者用にはどのような本を見ればよいのでしょうか。

例を2つ上げましたが,例2の値が知りたいのです。例1に関してはあるWEBで答えのみが返ってきたのですが(やり方は不明です)1.20e-06となっていました。
この違いはアルゴリズムの違いによるのでしょうか?

     [このページのトップへ]


4008. Re^2: P-value の計算の仕方 青木繁伸  2004/08/22 (日) 20:10
> 例を2つ上げましたが,例2の値が知りたいのです。

分析手法と,その分析結果を示しましょう。(例1についての某回答よりは親切でしょうが)

表に表すと次のようになるのでしょうか(間違えているかもしれませんが)
     有意な変化があった なかった 合計
Aである     5       10   15
Aでない    365      6891  7256
合計      370      6901  7271

さら さんと同じく,FIsher's exact test(R) です。

答え,p-value = 0.0006526 です。

     [このページのトップへ]


4030. Re^3: P-value の計算の仕方 まこまこ  2004/08/24 (火) 21:48
>      有意な変化があった なかった 合計
> Aである     5       10   15
> Aでない    365      6891  7256
> 合計      370      6901  7271
はじめまして
あの,いわゆる横レスというのだと思いますが,
1.有意な変化のありなしとAありなしの分割表の検定なのですが
「有意な変化」とあると分割の分割の是非にも曖昧さがあるから,普通に検定してはいけないような気がしました。
2.しかし,1)有意な変化があったかどうかという決定と2)Aであるかと変化あるかという事の検定は,全く別な検定であるから普通に検定して良いように考えました。
3.ならば(いさぎよく)Aでありなし/変化ありなしの分割表を書いた方がよい。つまり「有意な差が」をとってしまう。
4.その方が論文を読む人に誤解を生まないのではないでしょうか。
皆様,お教え下さい。

     [このページのトップへ]


4031. Re^4: P-value の計算の仕方 青木繁伸  2004/08/24 (火) 22:06
> 1.有意な変化のありなしとAありなしの分割表の検定なのですが
> 「有意な変化」とあると分割の分割の是非にも曖昧さがあるから,普通に検定してはいけないような気がしました。

ここで言われていた「有意な」変化というのは,「統計学的に」有意な変化ではなくて「その分野における」有意な変化ということだと受け取りましたが。(統計学がよくわからないといっていた質問者が,こので「統計学的に有意な変化があった」と意図していたか疑問)。

ま,原質問者がだんまりなので,真相はわかりません。

     [このページのトップへ]


4060. Re^5: P-value の計算の仕方 吉田  2004/08/25 (水) 21:39
青木先生

解説,コメントを有り難うございました。
もう少し勉強をしてから,また質問をさせて下さい。

「有意な」変化に関してですが,先生のおっしゃるとおりで,「統計学的に」有意な変化ではなくて「その分野において,一般的に有意と言われている変化」という意味で使いました。

     [このページのトップへ]


4057. Re^5: P-value の計算の仕方 まこまこ  2004/08/25 (水) 19:25
> ここで言われていた「有意な」変化というのは,「統計学的に」有意な変化ではなくて「その分野における」有意な変化ということだと受け取りましたが。(統 計学がよくわからないといっていた質問者が,こので「統計学的に有意な変化があった」と意図していたか疑問)。
>
> ま,原質問者がだんまりなので,真相はわかりません。
質問に答えて頂いて,有難うございました。(横レス者より)

     [このページのトップへ]


4007. Re^2: P-value の計算の仕方 青木繁伸  2004/08/22 (日) 19:59
言いたいことがたくさんあって,1000文字の制限に呈色したので,前のコメントはちょっといろいろ切りつめて腹ふくるる心地ですので追加です。

> 例を2つ上げましたが,例2の値が知りたいのです。例1に関してはあるWEBで答えのみが返ってきたのですが(やり方は不明です)1.20e-06となっていました。
> この違いはアルゴリズムの違いによるのでしょうか?

ここで聞くのではなくて,その答えを返してくれた人に聞くべきでしょう。
また,その結果は,ここへも報告すべきでしょうね。なぜだかは,面倒くさいので説明しません。わからなければわからないでかまわないかもしれませんが,それでは世間一般では通用しないかもしれません。

     [このページのトップへ]


4006. Re^2: P-value の計算の仕方 青木繁伸  2004/08/22 (日) 19:55
きつめのコメントをします。

基礎を勉強すべきですね。

> 表の分け方は解りますが,

でしたら,最初の質問で,さら さんが示したような,2×2分割表で示すべきです。さら さんは,吉田さんのデータを表にするためにちょっと手間を掛けたのですよ。

> 「Fisher's Exact Test によるとオッズ比の95%信頼区間が (6.56, 79.09)になります。」という意味が全く分かりません。

オッズ比の意味は,インターネットでも容易に検索できるでしょう。
ただ,今回の吉田さんの問題においてはオッズ比と言うよりは比率の差を示す方が簡便ではあったでしょうが。でも,原因と結果という文脈で,因果関係の強さを表すにはオッズ比は重要な概念です。

> 「そのようなデータの解析(検定)については,先行研究の論文を見ればわかることでしょう。」というご指摘ですが,初心者用にはどのような本を見ればよいのでしょうか。

先 行研究の論文で,あなたが直面した同じデータを(というか,先行研究を吉田さんが追試しているのではないですか。いや,吉田さんが世界初の仮説を探求して いるのかもしれませんが,そのような場合にどのようにして実験データを集積して,どのように解析し,どのように発表するかという実例は先行研究論文にある でしょう。先行研究論文もないような分野かもしれませんが,それならあなたの指導教官にでも質問するとか,,,それもできないと言うことかもしれません が,何にも参考にできるものがないというのは,なんだかな〜〜とおもいます??)。

> 例を2つ上げましたが,例2の値が知りたいのです。例1に関してはあるWEBで答えのみが返ってきたのですが(やり方は不明です)1.20e-06となっていました。

答えだけをもらったとき,「その答えはどのようにすれば得られるのでしょうか。何を学べばよいのでしょうか。」と聞くべきですね。

答えだけを聞いてそれでよしとするのは間違っています。
どのような手順,手法で解析すべきかを聞く必要があります。
だって,そうでしょう。
ある一つのデータについての答えを聞いてそれを論文に書けばそれでおしまい。というののでは,カンニングをしている学生と同じでしょう。なにも理解してはいないけど関門にはパスしたというのでは,何の意味もないです(研究者なんですから)。

「統計学について初心者です」といういいわけが通る場合とそうでない場合があるというのを,きちんと認識すべきです。

     [このページのトップへ]


4003. Re: P-value の計算の仕方 青木繁伸  2004/08/21 (土) 23:16
さら さんのコメントにつきますが,まずはあのように表の形にデータを整理する必要があるし,そのようなデータの解析(検定)については,先行研究の論文を見ればわかることでしょう。それをさぼっては,研究になりません。
なお,さら さんのコメントに付け加えれば,「P 値は0」ではなくて p-value = 4.909e-08 です。「4.909e-08 って,何だ?」なんて,いわないでね(^_^;)

     [このページのトップへ]


4009. Re^2: P-value の計算の仕方 さら  2004/08/23 (月) 07:01
> なお,さら さんのコメントに付け加えれば,「P 値は0」ではなくて p-value = 4.909e-08 です。

青木先生,率直な疑問です。
p-value = 4.9909e-08 を p-value = 0 とみなすことに問題はありますか? p-value は帰無仮説を棄却するかどうか,二者択一の判断材料にしかしない,という観点から,0.01(あるいはがんばって0.001)より小さい場合は p- value=0 と報告するようにしていましたが,このような場合にも 4.9909e-08 というような値を報告するべきなのでしょうか?

     [このページのトップへ]


4011. Re^3: P-value の計算の仕方 青木繁伸  2004/08/23 (月) 07:51
質問者への回答ありがとうございます。

> > なお,さら さんのコメントに付け加えれば,「P 値は0」ではなくて p-value = 4.909e-08 です。
>
> 青木先生,率直な疑問です。
> p-value = 4.9909e-08 を p-value = 0 とみなすことに問題はありますか? p-value は帰無仮説を棄却するかどうか,二者択一の判断材料にしかしない,という観点から,0.01(あるいはがんばって0.001)より小さい場合は p- value=0 と報告するようにしていましたが,このような場合にも 4.9909e-08 というような値を報告するべきなのでしょうか?

P値についてはおっしゃるとおり,さらさんの今までの解釈で問題ありません。
P = 4.9909e-08 などと書く必要はありません。

た だ,P が有意水準より遙かに小さい(0に近い)場合には,「P < 0.0001」 などと表記するのがよいかもしれません(P と比較する数値は,ほかの場所で P 値を小数点以下何桁まで表示するかにもよりますが,0.01 では大ざっぱすぎ,0.0001 では小さすぎ??)。

     [このページのトップへ]


4018. Re^4: P-value の計算の仕方 さら  2004/08/23 (月) 23:05
> ただ,P が有意水準より遙かに小さい(0に近い)場合には,「P < 0.0001」 などと表記するのがよいかもしれません(P と比較する数値は,ほかの場所で P 値を小数点以下何桁まで表示するかにもよりますが,0.01 では大ざっぱすぎ,0.0001 では小さすぎ??)。

丁寧な解説どうもありがとうございます。
p値の乱用誤用は目にあまるものがありますね。
信頼区間での結果の報告がもっと広まると良いのですが・・・

     [このページのトップへ]


3997. Re: P-value の計算の仕方 さら  2004/08/20 (金) 23:27
        変化した 変化しない
カテゴリーA  10      5
それ以外   626     6630

でFisher's Exact Test によるとオッズ比の95%信頼区間が (6.56, 79.09)になります。これでよいのではないでしょうか。p-valueは0です。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 030 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る