★ VIF値が高いデータについて ★

1611. VIF値が高いデータについて ha 2004/01/06 (火) 14:50
├1637. Re: VIF値が高いデータについて 青木繁伸 2004/01/07 (水) 13:23
│└1639. Re^2: VIF値が高いデータについて ha 2004/01/07 (水) 13:54
└1614. Re: VIF値が高いデータについて 青木繁伸 2004/01/06 (火) 14:59
 └1624. Re^2:多項ロジスティック? かんた 2004/01/06 (火) 21:14
  └1629. Re^3:多項ロジスティック? ha 2004/01/07 (水) 10:21
   └1634. Re^4:多項ロジスティック? 青木繁伸 2004/01/07 (水) 12:47
    ├1638. Re^5:多項ロジスティック? ha 2004/01/07 (水) 13:38
    └1635. Re^5:多項ロジスティック? 青木繁伸 2004/01/07 (水) 12:58


1611. VIF値が高いデータについて ha  2004/01/06 (火) 14:50
多重共線性がみられ,サンプルよりも説明変数が多いため,不向きでした。
データ自体がおかしいのは理解できるのですが,そのなかでも,意味のない説明変数を削除したいのです。

先生が教えてくださった多項ロジスティクを用いてみようと考えたのですが,多項ロジスティクのページや本を検索することができません。

より良いページをご教授いただけると幸いです。


SPSSの使用方法についての本に少し掲載されておりました。
>SPSSによる多変量データ解析の手順 石村 貞夫 

     [このページのトップへ]


1637. Re: VIF値が高いデータについて 青木繁伸  2004/01/07 (水) 13:23
> 先生が教えてくださった多項ロジスティクを用いてみようと考えたのですが,多項ロジスティクのページや本を検索することができません。

STATA の mlogit は,Multinomial(polytomous) logistic regression です。

マニュアルにやや詳しい(?)説明があります(少し暇になったら,もう少し勉強しようと思います)。

'mlogit' estimates maximum-likelihood multinomial logit models, also known as polytomous logistic regression.

Description of model
Consider the outcomes 1, 2, 3, ..., m recorded in y, and the explanatory variables X.

注:X は大文字で書かれているので,一応多変量でもかまわない。

参考文献として以下の3つがあげられていた(少ないなぁ)
* Aldrich and Nelson(1984, 73-77) Linear Probability, Logt and Probit Models, Newbury Park, CA: Sage publications.

* Greene(1993, chapter 21) Econometric Analysis, 2d ed. New York: Macmillan.

*Hosmer and Lemeshou(1989, 216-238) Applied Logistic Regression. New York: John Wiley & Sons.

ちなみに,logistic は Logistic regression で,

'logistic' estimates a logistic regression of depvar on varlist, where depvar is a 0/1 variable(or, more precisely, a 0/non-0 variable).

varlist は,リストですから多変量も可ということ(当然)

#好きこのんでやっているわけではないので,この程度の説明でご勘弁を(^_^;)

     [このページのトップへ]


1639. Re^2: VIF値が高いデータについて ha  2004/01/07 (水) 13:54
お返事誠にありがとうございます。

> STATA の mlogit は,Multinomial(polytomous) logistic regression です。

STATAというようなソフトがあるのですか。
調べてみます。


ありがとうございました。
多重ロジスティクと多項ロジスティクの違いは,私には難しく,勉強不足でした。

     [このページのトップへ]


1614. Re: VIF値が高いデータについて 青木繁伸  2004/01/06 (火) 14:59
> 多項ロジスティクのページや本を検索することができません。

そうなんですよね。日本語のページはまるっきりなくて,英語のページは少しはあるのですが(中身を読んでませんが)。

どなたか,フォローをお願いします。

     [このページのトップへ]


1624. Re^2:多項ロジスティック? かんた  2004/01/06 (火) 21:14
> > 多項ロジスティクのページや本を検索することができません。

>カテゴリーが0/1変数なので,多項ロジスティックモデルでもいいでしょう(多重ロジスティックモデルではない。私はよく知らない)。

多項ロジスティックモデルというのは,どういうものでしょうか。
多項ロジットモデルとは違うものでしょうか。

多項ロジットモデルなら反応変数は多値型です。
Agresti 『カテゴリカルデータ解析入門』サイエンティスト社
では多重ロジスティック回帰分析の説明のなかに,説明変数が多項の場合を入れています。

多項ロジットモデルのことを,spssではたしかに『多項ロジスティック回帰』といってますね。

     [このページのトップへ]


1629. Re^3:多項ロジスティック? ha  2004/01/07 (水) 10:21
> Agresti 『カテゴリカルデータ解析入門』サイエンティスト社
> では多重ロジスティック回帰分析の説明のなかに,説明変数が多項の場合を入れています。
>
> 多項ロジットモデルのことを,spssではたしかに『多項ロジスティック回帰』といってますね。

上記の本を注文したのですが,多重ロジックと多項ロジックは異なるのでしょうか・・・。
私もspssで多項ロジックという項目を見つけたのです。

     [このページのトップへ]


1634. Re^4:多項ロジスティック? 青木繁伸  2004/01/07 (水) 12:47
> > Agresti 『カテゴリカルデータ解析入門』サイエンティスト社
> > では多重ロジスティック回帰分析の説明のなかに,説明変数が多項の場合を入れています。

説明変数が階級化されていて,ある区間内において陽性者(1)と陰性者(0)の例数があって(割合(比率)が計算あれる場合ではないですか?これを logit model と言っているような。

4.3 LOGIT MODELS FOR CATEGORICAL DATA
Explanatory variables in th models discussed in the previous section(*4.2 LOGISTIC REGRESSION) can be continuous or categorical. When they are categorical, models with logit link are equivalent to loglinear models discussed in upcoming chapters.

従属変数はこの場合も二値データでしょう。
4.3.1 Logit Model for I x 2 Table
Suppose there is a single explanatory factor, having I categories. In row i of I x 2 table, the tow response probabilities are πi|i and π2|i, ... In the logit model
log(πi|i / π2|i) = α+βi.
ロジックとロジスティックは違います(どこからロジックという用語が?)
> 私もspssで多項ロジックという項目を見つけたのです。

     [このページのトップへ]


1638. Re^5:多項ロジスティック? ha  2004/01/07 (水) 13:38
> ロジックとロジスティックは違います(どこからロジックという用語が?)
> > 私もspssで多項ロジックという項目を見つけたのです。

検索をしていて,目にしたことがあり,ロジスティクの略語かと思い,ロジックを使用してしまいました。勉強不足で申し訳ないです。

     [このページのトップへ]


1635. Re^5:多項ロジスティック? 青木繁伸  2004/01/07 (水) 12:58
> 説明変数が階級化されていて,ある区間内において陽性者(1)と陰性者(0)の例数があって(割合(比率)が計算あれる場合ではないですか?これを logit model と言っているような。

このような場合も,元のデータ行列においては,ある個人が説明変数のどの階級に属していて,その個人の従属変数値が 0/1 の何れかという形をしています。
     従属変数  独立変数1 独立変数2
ケース1   0     1      A
ケース2   1     3      D
 :
このような場合,独立変数が名義尺度や順序尺度の場合にはダミー変数を使ってロジスティック回帰をすることになります。
なおこのような場合であっても,「Walker-Duncan らの方法では,これらの仮説(*1)を必要としないので,説明変数がどのような分布をとるもの(離散変量でもよい)であっても,正確な係数を求めることができる。」ということから(*2),順序尺度変数はそのまま用いることができるであろう(ちなみに,私のサイトにある多重ロジスティックモデルは,この Walker-Duncan 法によっている)。
*1 従属変数が多変量正規分布,等分散の仮説
*2 富永「治療効果判定のための実用統計学」蟹書房(第三回改訂版 p.59)

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 027 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る