★ 変数を絞るには ★

9428. 変数を絞るには 困った君 2006/02/17 (金) 11:40
└9429. Re: 変数を絞るには 青木繁伸 2006/02/17 (金) 12:22
 └9432. Re^2: 変数を絞るには 困った君 2006/02/17 (金) 15:15
  └9434. Re^3: 変数を絞るには 青木繁伸 2006/02/17 (金) 18:05
   └9444. Re^4: 変数を絞るには 困った君 2006/02/20 (月) 12:11
    └9445. Re^5: 変数を絞るには 青木繁伸 2006/02/20 (月) 12:52
     └9446. Re^6: 変数を絞るには 困った君 2006/02/20 (月) 15:53
      ├9448. Re^7: 変数を絞るには にゃんちゅう 2006/02/20 (月) 18:22
      │└9449. Re^8: 変数を絞るには 青木繁伸 2006/02/20 (月) 20:59
      │ └9451. Re^9: 変数を絞るには 困った君 2006/02/21 (火) 11:08
      │  └9454. Re^10: 変数を絞るには 青木繁伸 2006/02/21 (火) 12:10
      │   └9455. Re^11: 変数を絞るには 困った君 2006/02/22 (水) 11:28
      └9447. Re^7: 変数を絞るには 青木繁伸 2006/02/20 (月) 17:33


9428. 変数を絞るには 困った君  2006/02/17 (金) 11:40
目的変数が(0,1)のデータであり,説明変数の数が1000ほどのデータがあります。しかも,説明変数のデータもすべて(0,1)です。この場合に,説明変数の数に比べて,目的変数のデータは100ほどです。説明変数を選択したいのですが,どうすればよいのでしょうか?

     [このページのトップへ]


9429. Re: 変数を絞るには 青木繁伸  2006/02/17 (金) 12:22
> 説明変数の数に比べて,目的変数のデータは100ほどです。

って,どういうことですか?

手法はロジスティック回帰でしょうか?
変数選択は普通にやればよいと思いますが。

     [このページのトップへ]


9432. Re^2: 変数を絞るには 困った君  2006/02/17 (金) 15:15
> > 説明変数の数に比べて,目的変数のデータは100ほどです。
>
> って,どういうことですか?

 データ数が100ほどに対して,変数の数が1000以上あります。
 すべてのデータが,(0,1)の二値データですが,

> > 手法はロジスティック回帰でしょうか?
> 変数選択は普通にやればよいと思いますが。

 ロジスティック回帰で変数選択できるのでしょうか?

     [このページのトップへ]


9434. Re^3: 変数を絞るには 青木繁伸  2006/02/17 (金) 18:05
統計プログラムによるでしょうか?
あなたのお使いのプログラムは何ですか?

     [このページのトップへ]


9444. Re^4: 変数を絞るには 困った君  2006/02/20 (月) 12:11
> 統計プログラムによるでしょうか?
> あなたのお使いのプログラムは何ですか?

SASを使っています。
 (0,1)のデータだけなので,最尤推定量が求められないと思いますが,それでもロジスティック回帰を使って問題ないのでしょうか?

     [このページのトップへ]


9445. Re^5: 変数を絞るには 青木繁伸  2006/02/20 (月) 12:52
>  (0,1)のデータだけなので,最尤推定量が求められないと思いますが,

なぜそう思うのですか?
ダミー変数というのは扱いの上では比例尺度データと同じですよ。

     [このページのトップへ]


9446. Re^6: 変数を絞るには 困った君  2006/02/20 (月) 15:53
> >  (0,1)のデータだけなので,最尤推定量が求められないと思いますが,
>
> なぜそう思うのですか?
> ダミー変数というのは扱いの上では比例尺度データと同じですよ。

説明が足りなくて申し訳ありません。
今のデータの場合,説明変数(1000以上)に比べて,データの数が90ほどと非常に少ないのですが,このような場合でも処理できるのでしょうか?

     [このページのトップへ]


9448. Re^7: 変数を絞るには にゃんちゅう  2006/02/20 (月) 18:22
> 今のデータの場合,説明変数(1000以上)に比べて,データの数が90ほどと非常に少ないのですが,このような場合でも処理できるのでしょうか?

変数を絞るだけなら独立変数だけで主成分分析をして大まかなまとまりを見てみては? ただし,1,0 データのときには問題がありますが,様子をみるだけなら最初の1歩として使えるのでは。

     [このページのトップへ]


9449. Re^8: 変数を絞るには 青木繁伸  2006/02/20 (月) 20:59
> 変数を絞るだけなら独立変数だけで主成分分析をして大まかなまとまりを見てみては?

第一主成分に含まれる変数を重点的に採るのか,各主成分の上位からまんべんなくとるのか。悩むところかな?重回帰の考え方から言えば後者だし,普通に考えると前者だし。

変数選択は,ケース数<変数の数 の場合でも機能するので,とにかくやってご覧なさいと言うのが私のコメントの趣旨でした。
SAS ともあろうものが,変数選択をサポートしていないとは思えませんので。。。

やってみて,エラーや不都合が出たらその時点で,「くわしい情報を添えて」再質問なさるのが得策かと。そうしないと,「困ったさん」の質問ではなくて,「困ったさんの質問」になってしまいますよ(^_^)

     [このページのトップへ]


9451. Re^9: 変数を絞るには 困った君  2006/02/21 (火) 11:08
> > 変数を絞るだけなら独立変数だけで主成分分析をして大まかなまとまりを見てみては?
> やってみて,エラーや不都合が出たらその時点で,「くわしい情報を添えて」再質問なさるのが得策かと。

SASでロジスティック回帰の変数選択を行いました。そうしたところ,以下のようなメッセージが出力されます。

There is possibly a quasicomplete separation of data points in step 2. The maximum likelihood estimate may not exist.

The LOGISTIC procedure continues in spite of the above warning. Results shown are based on the last maximum likelihood iteration. Validity of the model fit is questionable.

どのように考えればよろしいのでしょうか?

     [このページのトップへ]


9454. Re^10: 変数を絞るには 青木繁伸  2006/02/21 (火) 12:10
分析に用いた変数によって100%(に近い)判別結果が得られることになるので,最尤解がない状態のこと。

http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc025/597.html
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc032/05380.html

変数の個数が観察数より多いので,もし全部の変数を使ったら当然そのようになるでしょうね。
変数選択オプションは付けたのでしょうか?

     [このページのトップへ]


9455. Re^11: 変数を絞るには 困った君  2006/02/22 (水) 11:28
> 分析に用いた変数によって100%(に近い)判別結果が得られることになるので,最尤解がない状態のこと。
>
> http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc025/597.html
> http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc032/05380.html
>
> 変数の個数が観察数より多いので,もし全部の変数を使ったら当然そのようになるでしょうね。
> 変数選択オプションは付けたのでしょうか?

青木先生,ありがとうございました。
さらに検討します。今後ともよろしくお願い致します。
なお,変数選択オプションは,いろいろと種類,条件をかえて検討しています。

     [このページのトップへ]


9447. Re^7: 変数を絞るには 青木繁伸  2006/02/20 (月) 17:33
質問して時間を費やすより,実際にやってご覧になったらいかがでしょう。

データの数が少なくて計算ができないというのなら,データを増やすしか道がないことになりますよねぇ。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 037 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る