★ トレンドのχ二乗検定 合計数が不一致の場合 ★

2503. トレンドのχ二乗検定 合計数が不一致の場合 おふ 2004/02/27 (金) 15:23
└2504. Re: トレンドのχ二乗検定 合計数が不一致の場合 青木繁伸 2004/02/27 (金) 15:53
 └2507. Re^2: トレンドのχ二乗検定 合計数が不一致の場合 おふ2(この件の最初の投稿者) 2004/02/27 (金) 20:51
  ├2512. Re^3: トレンドのχ二乗検定 合計数が不一致の場合 青木繁伸 2004/02/27 (金) 21:52
  └2510. Re^3: トレンドのχ二乗検定 合計数が不一致の場合 青木繁伸 2004/02/27 (金) 21:26
   ├2579. Re^4: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き おふ2 2004/03/04 (木) 03:29
   │└2582. Re^5: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き 青木繁伸 2004/03/04 (木) 09:01
   │ └2583. Re^6: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き おふ2 2004/03/04 (木) 10:22
   │  └2587. Re^7: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き 青木繁伸 2004/03/04 (木) 13:19
   │   ├2610. Re^8: トレンドのχ二乗検定 質問 (メッセージNo.2609)の続き おふ2 2004/03/04 (木) 21:46
   │   │└2617. Re^9: トレンドのχ二乗検定 質問 (メッセージNo.2609)の続き 青木繁伸 2004/03/04 (木) 23:11
   │   │ └2760. Re^10: トレンドのχ二乗検定 順序 (メッセージNo.2617へ) おふ2 2004/03/16 (火) 13:35
   │   └2609. Re^8: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き おふ2 2004/03/04 (木) 21:38
   ├2578. Re^4: トレンドのχ二乗検定 ソフト手順 おふ2 2004/03/04 (木) 03:26
   └2577. Re^4: トレンドのχ二乗検定 ソフト名 おふ2 2004/03/04 (木) 03:25


2503. トレンドのχ二乗検定 合計数が不一致の場合 おふ  2004/02/27 (金) 15:23
統計の初心者です。統計処理を補助して・・・データ整理をして生活しております。
職場ではソフトを使用して,トレンドのχ二乗検定のP値を出力しています。Excel VBAに移植したいと思っていろいろ調べようとしましたが,上司も近場の図書館も本屋もヒントを簡単にはくれません(専門書が近くにあまりないのです,上司がわかるのもタイトルにあるとおりの事だけだそうです)。
どなたか,数式や原理が乗っている本の題名だけでも,ヒントを下さい。(それ以上のヒントを下さるともっと嬉しいのですが・・・)よろしくお願いいたします。

使用したデータの例は
例1
   A,B,C,合計
1群 35,90,54,179
2群 29,76,77,182

導出されたP値(トレンドのχ二乗検定の値 らしい です。)
0.0353 例2    A,B,C,合計 1群 140,26,2,168 2群 145,36,1,182 導出されたP値 0.4979

です。
1群と2群のA.B.Cの傾向が同じであれば,P値がどうも高くなるという検定のようです。
EXCELを職場では使っておりますので,VBAでプログラム化できるように,したいと考えております。
当方,C言語,FORTRUN,BASICも少々かじっていますので,プログラムソースをご紹介いただいても大分助かります。
なにとぞ,よろしくお願いいたします。

     [このページのトップへ]


2504. Re: トレンドのχ二乗検定 合計数が不一致の場合 青木繁伸  2004/02/27 (金) 15:53
> 職場ではソフトを使用して,トレンドのχ二乗検定

どういう名前のソフトかという情報もなしですか。
「トレンドのχ二乗検定」というのが,そのソフトでの正式名ですか。

     [このページのトップへ]


2507. Re^2: トレンドのχ二乗検定 合計数が不一致の場合 おふ2(この件の最初の投稿者)  2004/02/27 (金) 20:51
回答ありがとうございます。 
ソフト名ですが・・・
すみません。ソフトの名前をチェックし忘れまして,,,月曜に見てきます。
また「トレンドのχ二乗検定」というソフト名ではありません。(多分です・・・他の統計もできるようでしたので違うのが濃厚です。)

青木先生がソフト名かと,おっしゃるということは・・・この方法の名前自体も,もしかしたら違うということでしょうか・・・
ネット上で検索もかけたのですが・・・出なかったのは,検定名からしてちがうと・・・・。
こちらのホームページのコクランアーミテージ検定も見たのですが変数の数からして違うと思ったのですが・・・・

検定の名前が異なっても,最初に書いた例1,例2の数字から P−valueが同じになる検定方法 があれば,教えて下さい。
よろしくお願いいたします。

     [このページのトップへ]


2512. Re^3: トレンドのχ二乗検定 合計数が不一致の場合 青木繁伸  2004/02/27 (金) 21:52
> 「トレンドのχ二乗検定」というのが,そのソフトでの正式名ですか。

であって,

> 「トレンドのχ二乗検定」というのが,そのソフトの正式名ですか。

ではありません

     [このページのトップへ]


2510. Re^3: トレンドのχ二乗検定 合計数が不一致の場合 青木繁伸  2004/02/27 (金) 21:26
ソフト名も検定名も不明とはちょっと???ですが。

R の prop.trend.test で同じ P 値が出ます。
群1,群2の観測度数を n1, n2 というベクトルとしたとき,
prop.trend.test(n1, n1+n2) ですね。
> n1 <- c(35, 90, 54)
> n2 <- c(29, 76, 77)
> prop.trend.test(n1, n1+n2)

    Chi-squared Test for Trend in Proportions

data:  n1 out of n1 + n2 ,
 using scores: 1 2 3 
X-squared = 4.4317, df = 1, p-value = 0.03528

> n1 <- c(140, 26, 2)
> n2 <- c(145, 36, 1)
> prop.trend.test(n1, n1+n2)

    Chi-squared Test for Trend in Proportions

data:  n1 out of n1 + n2 ,
 using scores: 1 2 3 
X-squared = 0.4593, df = 1, p-value = 0.4979

ただ,この使い方が正しいかどうか私にはわかりません。

google などで "chi square test for trend" とすればいろいろ出てきます。

R で,prop.trend.test とすれば,ソースを見ることができます。
さらにその中では,lm が使われており,その先は見えませんが lm では,重みつき回帰分析になっているようですね。

     [このページのトップへ]


2579. Re^4: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き おふ2  2004/03/04 (木) 03:29
メッセージNo.2577 2578 が私に分かる全てです。
検定方法があっているかどうかは・・・上司が研究者なので・・・(統計の専門家ではない)・・・
きっとあっているんだと思ってます。・・・ちなみに1群がコントロール群で2群が自然な状態での値です。

以下,質問です。
(念のため,最終目的はExcel VBAでChi-squared Test for Trend.のP値を導出するプログラムを書くことです。
数式的原理だけでも知りたいと思っております。)

英語力・統計用語に乏しい私には,翻訳ソフトを用いても完全な理解ができませんので,勘違いかもしれませんが,,,
先生にご紹介頂いた
> R の prop.trend.test で同じ P 値が出・・
る方法と,もしかしたら数式的に同じかもしれない・・・と思っているのですが・・・どうでしょうか?
ちがうとしたら,Rなどフリーの統計ソフトで数式的に同じ検定方法のソースが見れる方法を他にご存じないでしょうか?
また,日本語ではこれはなんという検定名なのでしょうか?
適合度のχ二乗検定 という名前なんでしょうか?

> R で,prop.trend.test とすれば,ソースを見ることができます
とおっしゃるのは,
「Rとは統計のフリーソフトで そのRの入力画面上でprop.trend.test と入力するとソースが出てくる。」
という意味ですよね?

残念ながら,何回かRの本家HPにいってダウンロードを試みているのですが,まだダウンロードできていないのですが・・・
ダウンロードでき次第,ソースを見てみたいと思います。

また,Rのソース?は ちょっと独特な感じがしますね・・・
Rのソースを読むには本格的に学ぶならS言語をマスターすればよいのでしょうか?

青木先生やこの問題が分かる方,引き続きよろしくお願いいたします。

     [このページのトップへ]


2582. Re^5: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き 青木繁伸  2004/03/04 (木) 09:01
>            Outcome A|Outcome B|Outcome C |
>     1群: |       35|       90|       54 |
>     2群: |       29|       76|       77 |
Outcome A|Outcome B|Outcome C | は,具体的にはどんなものですか?
答えるのが守秘義務にふれるようなことなら,「順序があるものですか」という問いに答えてください。

「上司が研究者なので」というのは,いいわけにもならないし,だから正しいはずという根拠にもなりません。

     [このページのトップへ]


2583. Re^6: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き おふ2  2004/03/04 (木) 10:22
> Outcome A|Outcome B|Outcome C | は,具体的にはどんなものですか?
> 答えるのが守秘義務にふれるようなことなら,「順序があるものですか」という問いに答えてください。

順序は便宜的に付けているものです。
頻度が高い方がA,頻度が低いものがCです。またはその逆です。
...のはず,です。
これも今日出社して調べてきます。

> 「上司が研究者なので」というのは,いいわけにもならないし,だから正しいはずという根拠にもなりません。

正しい理解には大事な点と言うことですね・・・
私の数式定義を知りたいという目的にもやはりそれは必要という事でしょうか・・・

他にも必要な情報があったらぜひ,教えてください。
できるだけ調べて参ります。
実験データなのですが,私は実験には直接触れていないので,分からないことだらけなのです。
(過去に一度も触れたことのない実験なのです・・・したがって想像も大概つきません・・すみません)
統計方法を解読する(?)のに必要な情報をご指摘頂ければ,幸いです。

     [このページのトップへ]


2587. Re^7: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き 青木繁伸  2004/03/04 (木) 13:19
> 順序は便宜的に付けているものです。
> 頻度が高い方がA,頻度が低いものがCです。またはその逆です。

聞いてよかった。
それはだめです。そのような場合に傾向検定を使ってはいけません。
出力結果にも書いてあるじゃないですか。

あなたが引用しているんですよ,

> ------Chi-squared Test for Trend.-------
> Note:This analysis is useful only if the categories definig the columns are arranged in a natural order
> (i.e. age groups,dose or time),with equal spacing between columns.

この注意書きをよく読んでください。あなたの(上司の)データは条件を満たしていますか?

> ...のはず,です。

上司もあなたもどちらも,理解を共有できる部分が少なくて,自分に理解できないところは相手に任せっきりというのは困ります。問題が生じたときに責任のなすりあいになります(^_^;)
「そうはいうけど,これはこういう理由で無理です,できません」と言えないといけません。

     [このページのトップへ]


2610. Re^8: トレンドのχ二乗検定 質問 (メッセージNo.2609)の続き おふ2  2004/03/04 (木) 21:46
順序があるのかどうか,私にはやはり,よく分からなくもあるのですが・・・

やっぱり,今回の例は便宜的,順序なんでしょうか?

しかし,青木先生,便宜的に血液型などを順位づけして統計を取る方法があったかと思います。
今回の例は等しい間隔には,該当しませんか?
傾向検定を使ってはいけないとして,どんな検定を選べばよいのでしょうか?
今回の場合を無視してもχ二乗による傾向検定の中身(数学的定義)を知りたいと思うのですが
。。。Rのprop.trend.test がそれに相当するのでしょうか?(そうすると,「χ二乗による傾向検定」とは「重みつき回帰分析」ということになるんでしょうか?)

> 聞いてよかった。
> それはだめです。そのような場合に傾向検定を使ってはいけません。

日本語では傾向検定というんですか?(直訳のようですが・・・「χ二乗」については前と後ろどっちに付くんでしょう?)

> 出力結果にも書いてあるじゃないですか。
>

> > ------Chi-squared Test for Trend.-------
> > Note:This analysis is useful only if the categories definig the columns are arranged in a natural order
> > (i.e. age groups,dose or time),with equal spacing between columns.

注:この分析は次の場合のみ有効です。カテゴリー列が自然な順序,等しい間隔で整列されているように定義される場合のみ有効です。(つまり,年齢集団,服用量あるいは時間などが該当します。

という訳で OKですよね。

入力して良かったです。(実は,DEMO版ではコピーが出来なかったし,量が多いのと多分にあたりまえのことが書いてあるんだろうから,掲示板にまで入れなくても良いかなとも思いながらもキー入力してたんです。
ネット上の無料翻訳(文の前後がいいかげんな翻訳)で大体の意味が掴めたかな・・・と思っていたのですが・・・掴めてなかった,です。(;_;) )

> 上司もあなたもどちらも,理解を共有できる部分が少なくて,自分に理解できないところは相手に任せっきりというのは困ります。問題が生じたときに責任のなすりあいになります(^_^;)
> 「そうはいうけど,これはこういう理由で無理です,できません」と言えないといけません。

言えるように,統計の知識を身につけたいと思います。現状では何ともしがたいです。(;_;) )
(今回のことは青木先生のおかげで自信をもって,「できません」とも言えるとおもいます)

     [このページのトップへ]


2617. Re^9: トレンドのχ二乗検定 質問 (メッセージNo.2609)の続き 青木繁伸  2004/03/04 (木) 23:11
> (今回のことは青木先生のおかげで自信をもって,「できません」とも言えるとおもいます)

早まってはいけません。

上司は上司で言ってるでしょ?
「ただしヘテロについては必ず,中央(OutcomeB)に入っており,このヘテロの位置が上司によれば重要」

つまり「自然な順序関係はある」ということ(順序関係があるように配置している)でしょう?

> 順序があるのかどうか,私にはやはり,よく分からなくもあるのですが・・・

そこを,対話により突き止めるのが共同研究(共同作業)でしょう。

> やっぱり,今回の例は便宜的,順序なんでしょうか?

是非とも,究明してください。その結果がどうであったかは,この掲示板を見ている人には無関係でしょうが,あなた方にとっては重大なことでしょうから。

> しかし,青木先生,便宜的に血液型などを順位づけして統計を取る方法があったかと思います。

本来順序関係のないカテゴリーデータであっても,「ある意図(「仮説)の下」では順序関係があることがありますよ。うそかほんとか分かりませんが,たとえば職業と胃潰瘍になりやすさの関連というようなものを考えると,当然(というか何というか)順序は付くのではないでしょうか?

> 今回の例は等しい間隔には,該当しませんか?

さ〜,どうでしょう。そのあたりは,統計学を離れますからね。データの実際の意味を知っている「上司」の知識がものを言うところでしょう。

> 傾向検定を使ってはいけないとして,どんな検定を選べばよいのでしょうか?

カテゴリーに順序関係がない場合には,件の出力の前段階に書いてあった,普通の「独立性の検定」に従えばいいのです。つまり,「二つの群では,書くカテゴリーに振り分けられる割合(分布)に差があるか」ということです。

> 今回の場合を無視してもχ二乗による傾向検定の中身(数学的定義)を知りたいと思うのですが
> 。。。Rのprop.trend.test がそれに相当するのでしょうか?(そうすると,「χ二乗による傾向検定」とは「重みつき回帰分析」ということになるんでしょうか?)

重み付きの回帰分析と同じということではなくて,検定手順の中に重みつき回帰分析を含んでいるということでは?(私も,それは把握していない。把握していれば,教えます(^_^;))

     [このページのトップへ]


2760. Re^10: トレンドのχ二乗検定 順序 (メッセージNo.2617へ) おふ2  2004/03/16 (火) 13:35
順序があるということが分かりました。
メッセージ2609での例(下記)で()内のBの数が順序です。
メジャーホモ(AA)では0個,ヘテロ(AB)では1個,マイナーホモ(BB)では2個。ということで順序になるそうです。

例は  
対立遺伝子のメジャーホモ(AA) 対立遺伝子のヘテロ(AB) 
対立遺伝子のマイナーホモ(BB)がOUTComeA,B,Cに順に入っていま
す。
1群;X病でないと思われる人
2群;X病の人
(例ここまで)

いくつかやってみたところ,私の知りたかったトレンドのχ自乗検定のP値は,コクラン・アーミテージ検定の「傾きの優位確率」と全く同じ値を示すことがわかりました。(青木先生が作成されたEXCEL用の計算プログラムを使わせて頂きました。ありがとうございました。)

青木先生のコクラン・アーミテージ検定のページの最初をよく読みましたら,
「独立変数が単調増加のとき,傾向検定としてもよく使われる」と示されていましたので,結局,「コクラン・アーミテージ検定の一部にトレンドのχ自乗検定が含まれている。」事が分かりました。
最初によく読まなかったばっかりに・・・申し訳ありません,こんな問題に付き合わせてしまいました。_(_ _)_

独立変数がまだどのような働きをするものだか,理解していないのですが,
とりあえず,コクラン・アーミテージ検定の全体を把握したいと思います。
(独立変数が単調増加でない,例ってどんな例でしょう?)

また,Rも無事下ろすことができました。
青木先生のおかげで,統計ソフト「R」も知ることができ,今後,統計の勉強がはかどりそうです。どうもありがとうございました。

,「χ二乗による傾向検定」とは「重みつき回帰分析」ということになるんでしょうか?)
>
> 重み付きの回帰分析と同じということではなくて,検定手順の中に重みつき回帰分析を含んでいるということでは?(私も,それは把握していない。把握していれば,教えます(^_^;))

把握して頂けることを期待しています。
私も,調べてみます。(歩みはおそいですが・・・分かったらご報告いたします)

本当にどうもありがとうございました。今後もよろしくお願いいたします。
(今度は誰かの力になれると良いのですが・・・)

     [このページのトップへ]


2609. Re^8: トレンドのχ二乗検定 質問 (メッセージNo.2577 2578)の続き おふ2  2004/03/04 (木) 21:38
順序について,この統計の実験に関っている人に聞いてまいりました。
やはり,「順序はない」との事でした。
しかし,全体が見えた方が,掲示板の皆様にも分かり易いと思いますので今回の例の統計内容を以下に掲示させて頂きます。

例の統計では対立遺伝子とある病気の関連を調べています(調べたいと思っています)。
(便宜上,ある病気をX病と名づけます)

メジャーかマイナーかは単純に調べた数内で多い方をメジャーと呼ぶ。
メジャーホモとマイナーホモの列位置は現在のExcel形式で保存されているデータでは逆になっていることもある。
ただしヘテロについては必ず,中央(OutcomeB)に入っており,このヘテロの位置が上司によれば重要なんだそうです。
ホモ,ヘテロについては,O型の存在しない血液型を考えて頂ければ分かり易いかと思います。

例は  対立遺伝子のメジャーホモ(AA) 対立遺伝子のヘテロ(AB) 対立遺伝子のマイナーホモ(BB)がOUTComeA,B,Cに順に入っています。
1群;X病でないと思われる人
2群;X病の人

注;2579 質問>・・・ちなみに1群がコントロール群で2群が自然な状態での値です。
と書いてあるのは間違いでした。すみません。

以上が,概要の全てです。

別に質問を掲載させて頂きますのでよろしくお願いいたします。

     [このページのトップへ]


2578. Re^4: トレンドのχ二乗検定 ソフト手順 おふ2  2004/03/04 (木) 03:26
ソフト名:Graphpad instat (GraphPad Software, Inc. 社のソフトで ホームページから30日間無料のデモソフトもダウンロードできるようです。ttp://www.graphpad.com/instat3/instatdemo2.htm )
ソフト中の検定名:Chi-squared Test for Trend.

私が出しているP-valueは次のような手順で出しています。
Setting (設定)
A Specify your goal: Analyzed a contigency table
B Choose a data entry format :Larger contigency table
(今回はtwo rows,three columnsです)

設定後,右下の水色の右向き矢印をクリックし,表に入力し,再び右下の矢印をクリックすると結果が出てきます。

結果は 例1の
      Outcome A|Outcome B|Outcome C |
1群: |    35|    90|       54 |
2群: |    29|    76|       77 |

の場合,
------Chi-squared Test for Independence.-------
Chi-squared :5.757 
Degree of freedom:2

Table size:2rows,3columns
The p value is 0.0562
the row and column variables are not signigicantly associated.

------Chi-squared Test for Trend.-------
Note:This analysis is useful only if the categories definig the columns are arranged in a natural order
(i.e. age groups,dose or time),with equal spacing between columns.

Chi-squared Test for Trend =4.432 (1 degree of freedom)
The P value is 0.0353.
There is a significant linear trend among the orderd categories
defining the columns and the proprtion of subjects in the top row.

という様に出てきます。

     [このページのトップへ]


2577. Re^4: トレンドのχ二乗検定 ソフト名 おふ2  2004/03/04 (木) 03:25
> ソフト名も検定名も不明とはちょっと???ですが。

遅くなりまして,すみません。
昨日まで風邪で寝込んでおりました。

また,当初には 掲示板運営者の先生から直接こんなにすばやくご回答が頂けるとは思ってもみず,1週間くらいでネット上でどなたかが運良く回答してくださるかもしれない・・・などと思っておりましたので,とりあえず,わかる範囲でも掲載させて頂こうと入力しました次第で・・・不備のある投稿をしてしまいまして,誠に申し訳なく思っております。また,ご回答,本当にありがとうございました。(理科系大学生だったころは思いも寄りませんでしたが,社会に出ると英語が読めない私には,本当に,理系の必要な本や情報を探すのも大変な苦労で・・・まさに,ここの掲示板には,灯火を見る思いで助けられました。青木先生,どうか,いつまでも掲示板の運営を続けてください。)

ところで,問題のソフト名,検定名が分かりました。
ソフト名:Graphpad instat (GraphPad Software, Inc. 社のソフトで ホームページから30日間無料のデモソフトもダウンロードできるようです。ttp://www.graphpad.com/instat3/instatdemo2.htm )
ソフト中の検定名:Chi-squared Test for Trend.

(手順は次のコメントで)

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 028 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る