No.01482 多変量解析について  【本多】 2006/11/01(Wed) 17:27

多変量解析の変数が量的データ(例えば年齢,体重,血圧)と質的データ(例えば女性,男性,日本人,アメリカ人)などが一 つの処理に混じっていてもよろしいのでしょうか。また質的データーにて例えば女性を1,男性を0,あるいは女性を1000,男性を1へと尺度を与えてもか まわないのでしょうか。 お手数ですがよろしくお願いいたします。

No.01483 Re: 多変量解析について  【生態学出身】 2006/11/01(Wed) 17:50

分けて考えたほうが無難だと思いますよ。母集団ごとにそれぞれ特徴があるから。統計学の教科書の最初のほうに,層別や階層という用語が出てきます。よく読んでください。

No.01484 Re: 多変量解析について  【本多】 2006/11/01(Wed) 18:00

ありがとうございました。

No.01485 Re: 多変量解析について  【青木繁伸】 2006/11/01(Wed) 19:13

層別してそれぞれの層で分析するというのも大切ですが,それでは層の効果を知ることができません。そのような場合 にはやはり,層を表す変数をダミー変数にして考察する必要があるでしょう。医学の分野における予後の解析など(ロジスティック回帰,Coxの比例ハザード モデルなど)で,性別や職業等のカテゴリーデータを取り扱う場合にはダミー変数として分析対象に取り入れていますね。

二値データの場合には,とりうる二つの数値がどのようであっても差し支えないです。
男と女を 1,2 で表そうが,1,1000 で表そうが,-5,10.2124で表そうが,0,1で表そうが同じです。その中では,0,1 で表すのがいろいろな意味で便利と言うだけです。

No.01487 Re: 多変量解析について  【本多】 2006/11/02(Thu) 00:04

詳細な説明ありがとうございました。参考になりました。

No.01488 Re: 多変量解析について  【生態学出身】 2006/11/02(Thu) 07:48

層の効果とは,性別,年齢,体重などの交互作用のことですね。一般的には,男女で層化して(女性でしか見られない 現象があるため),その後,年齢,喫煙,運動習慣などを調整して比較するのが普通ではないでしょうか?話は変わりますが,よろしければ,私の相談にものっ てください。
 今,牛乳の摂取量と生活習慣病との関連の論文を投稿して,reivsed されました。男女で階層を作って,上述したように群を調節したのち,偏相関を求め,共分散分析を行いました。一人のレフェリーが,女性には閉経があるこ と,もうひとりのレフェリーが,他の食事,野菜摂取や海草の摂取についても交絡因子に入れたほうが良いのでは,という回答でした。閉経は年齢である程度は カバーでき,crudeではほとんど関係がないこと,でいいと思うのですが,他の食事に関しては,意見が分かれるところだと思います。この分野の論文を見 ても,考慮しているものとしていないものがあります。一般的には,疫学は交絡に厳しいようです。よく例に出される,大腸がんへの野菜摂取の影響を調べるの に,肉類も調べないといけないと言うのと同じ論理だと思います。ただ,非常にまれな大腸がんと一般的に見られる肥満や高コレステロールをおなじようにあつ かってよいのか,交絡因子でも運動などそれ自体で非常に効果がある因子と食物繊維など弱い因子を同列にすること,摂取量などの測定そのものがあいまいなの に統計処理だけを厳密にすること,などの疑問があります。どなたかアドバイスいただければ幸いです。

No.01489 Re: 多変量解析について  【青木繁伸】 2006/11/02(Thu) 08:25

繰り返しますが,層別して共分散分析などをするのは常套手段ではありますが,それはやや古典的(古いといっているわけではないです)な手法ではないかということです。
層 別変数が1,2個の場合はそのような手法もとれますが,層別変数とはしないが従属変数に影響をおよぼす変数との境界はどんどん曖昧になっていきます。ま た,層別変数が仮に数個~10個にもなると,各層のサンプルサイズはどんどん小さくなっていき,そうでなくてもある層のサンプルサイズが小さくなるという ことはありがちです。そうなると分析精度は落ちる一方です。

Coxの比例ハザードモデル,多重ロジスティックモデルなどダミー変数を使う分析は一般的になってきていますね。

欧米では,質的変数をダミー変数として分析に組み入れることになんの違和感も感じないように見受けられますが,我が国では数量化理論を特殊視するように,質的変数は別扱いするように見受けられます。

No.01490 Re: 多変量解析について  【生態学出身】 2006/11/02(Thu) 08:59

青木先生がおっしゃるように,全体を一括してダミー変数を使うのは流行の方法かもしれません。ただ,統計的な解釈 は生命現象との因果関係がしっかりした上でのべなくてはいけません。目的にもよりますが,あくまでも母集団の中での影響や集団の特徴に科学的根拠を与える ためにに生物統計学は存在するものだと思います。まったく母集団が異なるもの,男と女,日本人とアメリカ人を同じ母集団として,解釈するのはムリがあるよ うな気がします。
 上で私があげた牛乳の例ですが,こういう多因子性を扱ったものは,どこまで交絡を考えるか非常に難しい問題です。交絡因子同士 の作用などは,解釈不可能です。わたしは農芸化学の出なんですが,リービッヒの「最少養分律」をどう考えるか,疫学や統計学の先生に問い詰めたいと思って います。残念ながら,少数派なんでしょうけど。
  

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る