★ 重回帰分析について ★

 121 重回帰分析について  book of saturday  2002/05/24 (金) 07:52
  124 Re: 重回帰分析について  sb812109  2002/05/26 (日) 15:54
   125 Re^2: 重回帰分析について  book of saturday  2002/05/26 (日) 16:43
    126 Re^3: 重回帰分析について  sb812109  2002/05/26 (日) 23:00
     127 Re^4: 重回帰分析について  book of saturday  2002/05/27 (月) 01:34
      129 Re^5: 重回帰分析について  sb812109  2002/05/27 (月) 20:13
       134 Re^6: 重回帰分析について  book of saturday  2002/05/27 (月) 23:36
        137 Re^7: 重回帰分析について  sb812109  2002/05/28 (火) 01:08
         138 Re^8: 重回帰分析について  sb812109  2002/05/28 (火) 01:09
          139 Re^9: 重回帰分析について  book of saturday  2002/05/28 (火) 04:14
           147 Re^10: 重回帰分析について  sb812109  2002/05/28 (火) 22:13
            149 Re^11: 重回帰分析について  book of saturday  2002/05/29 (水) 01:21
             150 Re^12: 重回帰分析について  book of saturday  2002/05/29 (水) 05:56
              157 Re^13: 重回帰分析について  sb812109  2002/05/30 (木) 23:48
               163 Re^14: 重回帰分析について  book of saturday  2002/06/01 (土) 05:33
               158 Re^14: 重回帰分析について  sb812109  2002/05/30 (木) 23:56
                161 Re^15: 重回帰分析について  青木繁伸  2002/05/31 (金) 21:22
                 162 Re^16: 重回帰分析について  book of saturday  2002/06/01 (土) 04:54
                  169 ありがとうございました。  book of saturday  2002/06/03 (月) 20:54
                159 Re^15: 重回帰分析について  青木繁伸  2002/05/31 (金) 11:47
                 170 Re^16: 重回帰分析について(ひとりごと)  出口慎二  2002/06/03 (月) 21:16


121. 重回帰分析について  book of saturday  2002/05/24 (金) 07:52
重回帰分析について御教示下さい。腫瘍の増殖能に関与する因子を調べています。ステップワイズ変数選択法により,患者の年齢,性別,発生部位など,名義変数,連続変数の混じった独立変数の中から増殖能を規定する因子を知ることが出来るのではないかと考えています(間違ってますでしょうか?)。ただし,いくつか問題があります。増殖能の測定法の都合上,極端に数値の小さいものは一律に0としており,増殖能が0である例が比較的多く存在します。よって腫瘍の増殖能は見た目にも正規分布になっていません。第一の質問は,このようなデータを連続変数として扱ってよいのか,という点です。第二に,正規分布か否かを判定する方法はあるのか否か?という点です。過去ログ168と170で,正規分布から大きく外れる場合は数量化Iを行なう方が良いかもしれないとの御指摘が青木先生からありました。第三の質問ですが,大きく外れることを示す具体的な基準があるのでしょうか。数量化Iの有用性はよく知りませんが,馴染みが無いのでできればステップワイズを使いたいのですが。

     [このページのトップへ]


124. Re: 重回帰分析について  sb812109  2002/05/26 (日) 15:54
> 数量化Iの有用性はよく知りませんが,馴染みが無いのでできればステップワイズ
> を使いたいのですが。

数量化I類は,統計解析手法の1つであり,ステップワイズ法は,モデル構築法(説明変数の選択法)です。二者択一ではなく,数量化I類(あるいは他の回帰分析法)に,ステップワイズ法を使用するか否かと云うことになります。

> 第一の質問は,このようなデータを連続変数として扱ってよいのか,という点です。

腫瘍の増殖能を連続量としてではなく,大きい/小さいの2群とすると,2X2分割表として解析できますので,多変量解析に馴染みがなくとも実用的な解析が可能となりますし,また,解釈もより明快になると思います。

> (前略)独立変数の中から増殖能を規定する因子を知ることが出来るのではないかと
> 考えています(間違ってますでしょうか?)。

間違っていると云うわけではないのですが,book of Saturday さんが行おうとしていることは,データマイニング的手法を志向している様に思われます。この様なアプローチがヒトの生死に関わる臨床研究に適用されることの是非は,十分に議論がなされているのでしょうか?

     [このページのトップへ]


125. Re^2: 重回帰分析について  book of saturday  2002/05/26 (日) 16:43
>二者択一ではなく,数量化I類(あるいは他の回帰分析法)に,ステップワイズ法を使用するか否かと云うことになります。
なるほど,そういうことですか。ありがとうございます。

>連続量としてではなく,大きい/小さいの2群とすると,2X2分割表として解析できますので,
カイ2乗検定は比較的頻繁に使っていますので,その方法も考えました。ただ,統計手法としての明瞭さは別として,2X2分割でp値を示すより,実数をプロットしたグラフを示した方が,読む人,見る人へのインパクトがあると思った次第です。

>データマイニング的手法を志向している様に思われます。
データマイニング的とはどういう意味でしょうか。よろしければ御教示下さい。

>臨床研究に適用されることの是非
単なる数値と捉えれば,他の解析と同じと思うのですが。あるいは倫理的に,ということでしょうか?

     [このページのトップへ]


126. Re^3: 重回帰分析について  sb812109  2002/05/26 (日) 23:00
データ分析は,大きく2つに分類することが出来ます。
(1)確証的データ分析:仮説を立て,採択,棄却を行います。
(2)探索的データ分析:仮説を立てず,データ間の関連を探索します。
(2')データマイニング:(2)を機械的,系統的,網羅的に行います。

(1)は,古典的統計解析の方法論です。(2),(2')は,コンピュータの機能向上
と統計ソフトの登場と共に急速に普及して来た方法です。(2),(2')の方法で得ら
れる結果は,chance finding である可能性が高くなります(例えば,手持ちのデータ
を無作為に3群に分け,ステップワイズ法で説明変数の選択を行ってみて下さい。効率
よく最良のモデルが得られるでしょう。ただし,唯一のではなく,"3種類!"の)。

Chance finding であれ,何であれ,一度,公表されればそれなりの重みを持ち一人歩
きを始めます。それに基づいて臨床判断が下されるかも知れません。その様な危惧に対
して十分な議論がなされているのでしょうか?

     [このページのトップへ]


127. Re^4: 重回帰分析について  book of saturday  2002/05/27 (月) 01:34
データマイニングの御説明,誠にありがとうございました。ただ,残念ながら今度はchance finding という言葉の理解が今一つです。もし,よろしければ御教授いただければ…(しつこいですが)

>それに基づいて臨床判断が下されるかも知れません。
>その様な危惧に対して十分な議論がなされているのでしょうか?

臨床判断,という言葉をどのような場面を想定して使っていらっしゃるか分からないので,詳しい説明は控えます。ただ,Risk factorを探索することは非常に有益なことである,との認識に立っています。多数例の集団でのrisk factorが発見したとて,それを個々の症例の治療に直結させることはありません。

具体的にはどのような『臨床判断』を危惧しておられるのですか?

統計解析について議論がなされているかどうかは知りませんが,この種の解析はあまたpublishされています。

     [このページのトップへ]


129. Re^5: 重回帰分析について  sb812109  2002/05/27 (月) 20:13
> Chance finding

「普遍性・再現性に乏しい偶然に得られる知見」の意味で使っています。

> 臨床判断

例を挙げると,「大規模な臨床疫学研究により,喫煙と肺癌の関連が強く疑われる
(危険因子の同定)ので,禁煙指導(臨床判断:臨床への適用)を行う」と云った
意味で使っています。

> 多数例の集団でのrisk factorが発見したとて,それを個々の症例の治療に直結さ
> せることはありません。

もし,そうであるなら,臨床研究に関する膨大な量の論文,発表・議論は何の為にな
されているのでしょう?虚無への供物?

> この種の解析はあまたpublishされています。

そうです。この種の方法論は,ある種,典型的なのです。
(1) 手持ちデータをステップワイズ法で"解析"し,統計学的に有意な説明変数の
組を拾い出す。
(2) その結果に対して,医学的に合理的な説明を行う。
(3) 発表

いーのかな〜? 
ま,21世紀の解析法と云うことで,,,。

     [このページのトップへ]


134. Re^6: 重回帰分析について  book of saturday  2002/05/27 (月) 23:36
> 「普遍性・再現性に乏しい偶然に得られる知見」の意味で使っています。

なるほど,そういうことですか。そういう知見が得られる可能性のある手法を,生死に関わるテーマで扱うのは問題があるかもしれない,ということですね。では,仮説を立てて棄却する,という古典的手法を併用すれば解決するのでしょうか?

> 虚無への供物?

説明が不十分であったようです。遺伝子の異常とかかなり根元的な因子を突き止めたとしても,現時点で対応できないものがほとんどだし,そもそも対応が不可能なものも(性とか年齢とか)もあるわけです。まあ,個々の症例に役立てることが理想ですが,そういうことは一般的にはまれだと思います。ただし,はなから諦めている訳ではありません。

> (1) 手持ちデータをステップワイズ法で"解析"し,統計学的に有意な説明変数の組を拾い出す。
> (2) その結果に対して,医学的に合理的な説明を行う。
> (3) 発表
> いーのかな〜? 

ほかにあったら教えていただけませんか。

     [このページのトップへ]


137. Re^7: 重回帰分析について  sb812109  2002/05/28 (火) 01:08
説明変数が10個あったとします。ある説明変数はモデルに選ばれるか,選ばれないか
2つに1つですから,2^10==1024個のモデルが評価の対象となります(ただし,交互
作用は考えない)。1024個のモデル全てに関し,AIC(モデルの良さの指標と考えて
下さい)を算出します。モデルは,このAICにより,1番から1024番まで順位を付ける
ことが出来ます。ステップワイズ法は,総当り法を採ることなく,1番のモデル(ある
いは,それに近いモデル)を拾い出すことが出来ます。

つまり,統計学的根拠からは,ステップワイズ法は非常に優れた方法であり,敬遠する
理由は何もありません。しかし,現実のデータは,様々な擾乱により不完全です。不完
全なデータに基づき,最良のモデルを求めても,不完全な結果しか得ることが出来ませ
ん。このデータの不完全さを補い,より真に近づくには,その分野における知識,経験
洞察力等が必須だと思っています。従って,ステップワイズ法により得られた結果と
book of Saturday さん自身が行ったχ2乗検定によって得られた結果があった場合,
後者の方がより真に近いと思います。

     [このページのトップへ]


138. Re^8: 重回帰分析について  sb812109  2002/05/28 (火) 01:09
> ほかにあったら教えていただけませんか。

(1)(帰無)仮説の設定
(2)研究デザイン(データ収集法)の決定
(3)データ収集
(4)統計解析
(5)帰無仮説の採択,あるいは棄却
(6)考察
(7)発表

     [このページのトップへ]


139. Re^9: 重回帰分析について  book of saturday  2002/05/28 (火) 04:14
研究のデザインはいつも念頭においていますが,色々な制約から自由に出来る場合とそうでない場合があったり,考えても考えてなくても似たようなデザインに落ち着いてしまうことがあるのはご存知のことと思います。また,関連あるか無いか『全く』分からない手持ちのデータをかき集めて解析を始める人はいくらなんでもいませんし,そのような解析結果は到底acceptされないでしょう。1,2,3,4,6,7は当然のこととして,お聞ききしたかったのは(5)です。しかしRe^8で既に答えていただきました。カイ2乗を推奨される理由がよく分かりました。

ついでと言っては何ですが,もう一つ教えていただけますか?臨床研究でも,現実的には多変量解析が頻繁に行なわれていますが, sb812109さんはそのデータの不完全さゆえに多変量解析を行うことは避けるべきとお考えなのでしょうか?今までの流れからはそう受け取れます。

     [このページのトップへ]


147. Re^10: 重回帰分析について  sb812109  2002/05/28 (火) 22:13
違います。私は,多変量解析の信奉者です。

信頼性の高い順番に挙げますと次の様になります。
(1)研究者とstatistician が共同で行った多変量解析
(2)研究者が単独で行った多変量解析,あるいは古典的統計解析
(3)研究者もstatistician も介入しない多変量解析(例,ステップワイズ法)

データの不完全さを補うには,研究者の知識や経験,慧眼が必要です。従って,(3)が最も信頼性が低いと思います。数学モデルに基づく現代の多変量解析が,古典的統計解析より優れているのは,言うまでもありません。

ただし,上記信頼性の順位は,医療データの性質上,私はその様な印象を持っていると言うことであって,他の人,あるいは他の分野では全く違うのかも知れません。例えば,自立型ロボットの中で,ステップワイズ法のプログラムが動いていると聞かされたとしても,私は驚きません。

     [このページのトップへ]


149. Re^11: 重回帰分析について  book of saturday  2002/05/29 (水) 01:21
> 違います。私は,多変量解析の信奉者です。

re7では医学データの撹乱の問題から,古典的手法を勧めていただいたので,どちらが良いのか苦慮しています。どちらも多数publishされているので,どちらでもでも良いのでしょうが。『厳密には臨床データの撹乱性から,帰無仮説の棄却を行うのが真に近い可能性が高いが,現実的には多変量解析も行なわれ,今のところ概ね認められている。』という理解で良いのですか?

> 信頼性の高い順番に挙げますと次の様になります。

だからこそ,教えを乞うているわけです。私がずっとお聞きしたかったことは(不明瞭だったかもしれませんが),『統計に明るい者が行う解析が,そうでない者が行う解析より優れているか』ということではなくて,適切に解析ができると仮定して,つまり(1)に準じた条件下で『多変量解析を行う場合と,古典的手法を用いる場合とどちらが優れているか』という点です。なぜ,こんなことに食い下がるかというと,『ステップワイズ法では,従属因子に影響を与える独立因子が重要なものから順番に示されるが,帰無仮説の棄却では順序はわからない』と考えており,それがある研究では魅力的である場合があるからです。

     [このページのトップへ]


150. Re^12: 重回帰分析について  book of saturday  2002/05/29 (水) 05:56
以下のようにおっしゃっておられますね。

>数学モデルに基づく現代の多変量解析が,古典的統計解析より優れているのは,言うまでもありません。

肝心なコメントを見落していました。どうもありがとうございました。

     [このページのトップへ]


157. Re^13: 重回帰分析について  sb812109  2002/05/30 (木) 23:48
2x2分割表による解析
(1)従属変数を行に,独立変数を列にして2x2分割表を作成
(2)オッズ比(ad/bc)は,相関の強さを表す
(3)他の因子で層別化し,(1)〜(2)を求める.層別化の有無で,
3-1)オッズ比が変わらなければ,重要な因子ではない
3-2)オッズ比が大きく変わるが,層別ごとのオッズ比は
    ほぼ同じであれば,交絡因子
3-3)オッズ比が大きく変わり,層別ごとのオッズ比も,
    異なる場合,交互作用

(1)は集計,(2)は単変量解析になる。
(3)は既に最も単純な多変量解析を行うことを意味し,実際に,モデル構
築の意味付けや,交絡因子,交互作用等,重要な概念が出てくる。

層別化を2つ以上の因子で同時に行おうとすると,非常に煩雑になるの
で現実的には,統計ソフトを利用し多変量解析(この場合は,ロジスティック
回帰分析)を行うことになる。

なぜ,古典的解析法を薦めるか?
1)古典的解析法でも十分解析は可能。
2)多変量解析を使うにしても,上記の様な概念は必須。
3)結果が妥当か否かの判別が容易(いきなり多変量解析を行い,結果の不
  自然さに気づかず,痛い目に遭ったことが一度ならずある。個人的経験)。

     [このページのトップへ]


163. Re^14: 重回帰分析について  book of saturday  2002/06/01 (土) 05:33
> 層別化を2つ以上の因子で同時に行おうとすると,非常に煩雑になるの
> で現実的には,統計ソフトを利用し多変量解析(この場合は,ロジスティック
> 回帰分析)を行うことになる。

なるほど,ロジスティック回帰分析は2x2分割表を多数の因子で行うようなものと考えて良いわけですか。

> なぜ,古典的解析法を薦めるか?
> 1)古典的解析法でも十分解析は可能。
> 2)多変量解析を使うにしても,上記の様な概念は必須。
> 3)結果が妥当か否かの判別が容易

それは仰る通りだと思います(専門家に向かって,そんな物言いもなんですが)。ただ古典的手法で帰無仮説の棄却する場合,個々の判別は容易でも,有意な変数が多い場合,素人からすると全体の解釈に困ることがあります。統計をあまり知らない人間にとっては,重回帰分析におけるステップワイズ法なら回帰係数,ロジスティック回帰分析ならオッズ比,比例ハザードモデルによる生存分析ならハザード比のような影響の大小を示してくれるような数値は非常に魅力的に映ります。

     [このページのトップへ]


158. Re^14: 重回帰分析について  sb812109  2002/05/30 (木) 23:56
>『ステップワイズ法では,従属因子に影響を与える独立因子が重要なものから
> 順番に示される

そんなこと,いいな♪ できたら,いいな♪

出典を教えて下さい。

     [このページのトップへ]


161. Re^15: 重回帰分析について  青木繁伸  2002/05/31 (金) 21:22
> 出典を教えて下さい。

もしかしたら私のページが犯人かもしれませんが,私のページはこういう風になっています。

http://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/mreg7.html

不適切な表現は,ご指摘いただければ修正するにやぶさかではないです。

     [このページのトップへ]


162. Re^16: 重回帰分析について  book of saturday  2002/06/01 (土) 04:54
> そんなこと,いいな♪ できたら,いいな♪

『危険率の小さい説明変数のうち,回帰係数の大きいものほど目的変数への影響が大きい』と本で読んで信じ込んでいるのですが,違うのですか?これが誤りでないなら,影響の強い説明変数を順番に示すことが可能だと思うのですが。

     [このページのトップへ]


169. ありがとうございました。  book of saturday  2002/06/03 (月) 20:54
sb812109さん,青木先生,どうもありがとうございました。一部,不明な点も残りましたが,大体理解できたように思います。

     [このページのトップへ]


159. Re^15: 重回帰分析について  青木繁伸  2002/05/31 (金) 11:47
> >『ステップワイズ法では,従属因子に影響を与える独立因子が重要なものから
> > 順番に示される
>
> そんなこと,いいな♪ できたら,いいな♪
>
> 出典を教えて下さい。

厳密にいうと正しいとは言えないが,実用上はこれでいいのでは?

     [このページのトップへ]


170. Re^16: 重回帰分析について(ひとりごと)  出口慎二  2002/06/03 (月) 21:16
せっかく途切れたところ,ごめんなさい.

このスレッドの,論点の中には,その,

>厳密にいうと正しいとは言えないが,

の部分と言いましょうか,そんな部分もあるように感じます.

「スッキリ」した統計処理,という発想,と言いますか,それに対する自覚の度合いと言いますか....

ましてや,結果が一人歩きした場合の影響が深刻かもしれない場面で.

#もちろん,青木先生他,誰かに対して言っているのではないです.
#独り言みたいなニュアンスです.

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 019 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る