★ 質的変数どうしの相関のようなもの? ★

 105 質的変数どうしの相関のようなもの?  カイセキ  2001/01/04 (木) 00:09
  124 Re: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/05 (金) 07:48
   126 Re^2: 質的変数どうしの相関のようなもの?  上田太一郎  2001/01/05 (金) 09:25
  111 Re: 質的変数どうしの相関のようなもの?  上田太一郎  2001/01/04 (木) 20:04
   112 Re^2: 質的変数どうしの相関のようなもの?  nobody  2001/01/04 (木) 20:42
    123 Re^3: 質的変数どうしの相関のようなもの?  上田太一郎  2001/01/05 (金) 07:28
  108 Re: 質的変数どうしの相関のようなもの?  nobody  2001/01/04 (木) 14:24
   122 Re^2: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/05 (金) 07:24
    128 Re^3: 質的変数どうしの相関のようなもの?  名無しさん@日本  2001/01/05 (金) 10:12
  107 Re: 質的変数どうしの相関のようなもの?  ロンロン  2001/01/04 (木) 09:20
  106 Re: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/04 (木) 06:47
   109 Re^2: 質的変数どうしの相関のようなもの?  nobody  2001/01/04 (木) 14:43
    125 Re^3: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/05 (金) 09:18
     129 Re^4: 質的変数どうしの相関のようなもの?  名無しさん@日本  2001/01/05 (金) 12:09
      130 Re^5: 質的変数どうしの相関のようなもの?  名無しさん@日本  2001/01/05 (金) 12:10
       143 Re^6: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/07 (日) 03:14


105. 質的変数どうしの相関のようなもの?  カイセキ  2001/01/04 (木) 00:09
質的変数と数的変数との両方を説明変数として導入して重回帰分析によるモデルを作成しようとしています。
ここで質問です。
数的変数なら相関を求められて,重回帰分析の変数にふさわしいかどうかを確かめられますよね?
しかし質的変数ではクロス集計で傾向をみるぐらいしか思いつきません。
なにか説明変数として適しているかどうかを判別する良い方法はありますでしょうか?

     [このページのトップへ]


124. Re: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/05 (金) 07:48
あと,題名と質問が少し食い違いましたが,

数的変数を重回帰分析に使用するときは,多重共線性の問題が重要ですよね。
ふつうは説明変数どうして相関をみて,どちらかを削除するというのが一般的だと思うのですが,質的変数どうしの場合はどうやってカテゴリー間の相関をみればいいのでしょうか?
ダミー変数だから,アイテムごとなら相関は出せるのでしょうが・・・
質的変数の場合は,多重共線性の問題は考慮しなくていいのでしょうか?
考慮しなければいけない場合は,考慮の方法を教えてください。お願いします。

     [このページのトップへ]


126. Re^2: 質的変数どうしの相関のようなもの?  上田太一郎  2001/01/05 (金) 09:25
> あと,題名と質問が少し食い違いましたが,数的変数を重回帰分析に使用するときは,多重共線性の問題が重要ですよね。
> ふつうは説明変数どうして相関をみて,どちらかを削除するというのが一般的だと思うのですが,質的変数どうしの場合はどうやってカテゴリー間の相関をみればいいのでしょうか?
> ダミー変数だから,アイテムごとなら相関は出せるのでしょうが・・・
・カテゴリ同士の相関は意味がありません。アイテム同士の相関は回帰係数(カテゴリスコア)を求め元のデータに該当しているところに代入します。このデータで回帰分析を実行します。(この説明でわかりますか?)あとは回帰分析の問題です。
> 質的変数の場合は,多重共線性の問題は考慮しなくていいのでしょうか?
・私はこれを避けるために直交表を用いてアイテム・カテゴリを割付けています。

     [このページのトップへ]


111. Re: 質的変数どうしの相関のようなもの?  上田太一郎  2001/01/04 (木) 20:04
> 質的変数と数的変数との両方を説明変数として導入して重回帰分析によるモデルを作成しようとしています。
> 数的変数なら相関を求められて,重回帰分析の変数にふさわしいかどうかを確かめられますよね?
私も現実の問題でよくぶつかります。ダミー変数を取り入れた回帰分析ですね。このとき,ダミー変数が被説明変数に効いているかをどう調べるかが問題になります。
Excelの回帰分析を使った場合には,簡便法として私は影響度を定義して,この影響度の大小で判定するのです。影響度はダミー変数(アイテム)の場合では回帰係数(カテゴリスコア)のレンジです。数的変数では回帰係数*そのデータのレンジです。
さらに,どの変数(要因)を式に取り込むかどうかは,要因選択規準たとえば,Ru=1-(1-重相関係数の自乗)*(データ数+要因の個数+1)/(データ数ー要因の個数ー1)が最大となるのが最適な式とします。詳細は弊著「データマイニング実践集」共立出版をご覧ください。
また,よろしければ私にデータを送ってください。解析してみます。

     [このページのトップへ]


112. Re^2: 質的変数どうしの相関のようなもの?  nobody  2001/01/04 (木) 20:42
> 影響度は...中略...数的変数では回帰係数*そのデータのレンジです。

前に指摘して,同意されたように,標準化偏回帰係数の方が良く知られています。
また,ダミー変数の場合も,レンジと標準化偏回帰係数では判断が必ずしも一致しないと思います。

> さらに,どの変数(要因)を式に取り込むかどうかは,要因選択規準たとえば,Ru=1-(1-重相関係数の自乗)*(データ数+要因の個数+1)/(データ数ー要因の個数ー1)が最大となるのが最適な式とします。

変数選択基準も偏F値というのがありますが,どうでしょう?

あなたのお説を広めるのもよろしいかと思いますが,普遍的に用いられているものがある場合には少なくともそれを併記された方が無用な誤解を生じないと思います。

     [このページのトップへ]


123. Re^3: 質的変数どうしの相関のようなもの?  上田太一郎  2001/01/05 (金) 07:28
> また,ダミー変数の場合も,レンジと標準化偏回帰係数では判断が必ずしも一致しないと思います。
そのとおりです。たまにあります(経験的には5%くらい?)。簡便法は直感的にわかりやすくこれで説明しています。
ダミー変数のとき,標準化したとしても,ランク落ちをしてしまい,1つのカテゴリ列を削除して実行しなければなりません。削除する列によってP値(危険率)がころころ変わってしまいます。これを避けるために回帰係数のレンジを使っています。
> 変数選択基準も偏F値というのがありますが,どうでしょう?
これもいいと思います。その他,AIC,芳賀他の規準,佐和の規準,竹内の規準,Cpなどいろいろあります。調べてみましたが,どれを使っても,最適な回帰式はほぼ一致します。久米・張の論文(”回帰分析における変数選択について”1980年「品質」,10)も参考にしました。
> あなたのお説を広めるのもよろしいかと思いますが,普遍的に用いられているものがある場合には少なくともそれを併記された方が無用な誤解を生じないと思います。
ここでは,併記しませんでした(すみません)がセミナー等では紹介しています。

     [このページのトップへ]


108. Re: 質的変数どうしの相関のようなもの?  nobody  2001/01/04 (木) 14:24
> なにか説明変数として適しているかどうかを判別する良い方法はありますでしょうか?

ダミー変数にしているのだから,そのまま標準化偏回帰係数で評価できるのではないですか?

     [このページのトップへ]


122. Re^2: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/05 (金) 07:24
> > なにか説明変数として適しているかどうかを判別する良い方法はありますでしょうか?
>
> ダミー変数にしているのだから,そのまま標準化偏回帰係数で評価できるのではないですか?

標準化偏回帰係数っていうのは,質的変数を扱った場合,アイテムごとに算出されますよね?

カテゴリー自体が適しているのかどうかを判断するにはどうしたらいいのでしょうか?ひとつのカテゴリー内のアイテムでも,標準偏回帰係数の大きいものとゼロに近いものがあるのですが・・・
質的変数の場合は,数的変数のようにカテゴリーの偏回帰係数のようなものはないのでしょうか?

     [このページのトップへ]


128. Re^3: 質的変数どうしの相関のようなもの?  名無しさん@日本  2001/01/05 (金) 10:12
> 質的変数の場合は,数的変数のようにカテゴリーの偏回帰係数のようなものはないのでしょうか?

数量化I類の場合は,従属変数とアイテム変数の関係を表す偏相関係数が計算されます。あなたの見たページにその算出方法も書いてあるようですよ。

     [このページのトップへ]


107. Re: 質的変数どうしの相関のようなもの?  ロンロン  2001/01/04 (木) 09:20
> 質的変数と数的変数との両方を説明変数として導入して重回帰分析によるモデルを作成しようとしています。

とりあえず,

回帰分析と主成分分析 芳賀 敏郎/著; 日科技連

にある方法を使ったら。

何か新しい方法を開発するつもりですか?

     [このページのトップへ]


106. Re: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/04 (木) 06:47
ちなみに,エクセル統計を使ってダミー変数を用いた重回帰分析を行ったのですが,数量化理論I類と同じ結果になりません。なぜでしょうか?
http://aoki2.si.gunma-u.ac.jp/LaTeX/SREG-QT1.html
↑ここを参考にしながらおこなったのですが,重相関係数や決定係数が微妙に異なってしまいます。

     [このページのトップへ]


109. Re^2: 質的変数どうしの相関のようなもの?  nobody  2001/01/04 (木) 14:43
> 重相関係数や決定係数が微妙に異なってしまいます。

エクセル統計を持っていないので何ともいえないのですが,正しい使用法に基づいても微妙に異なる結果が出るというのは,エクセル統計に内在する問題かもしれませんね。
数値計算的に問題となるのは,逆行列を求めるところでしょうね。計算アルゴリズムがまずいと変なことになるかもしれない。
微妙に違うのは重相関係数と決定係数だけですか?どれくらい違うのでしょうかね。

     [このページのトップへ]


125. Re^3: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/05 (金) 09:18
> > 重相関係数や決定係数が微妙に異なってしまいます。
>
> エクセル統計を持っていないので何ともいえないのですが,正しい使用法に基づいても微妙に異なる結果が出るというのは,エクセル統計に内在する問題かもしれませんね。
> 数値計算的に問題となるのは,逆行列を求めるところでしょうね。計算アルゴリズムがまずいと変なことになるかもしれない。
> 微妙に違うのは重相関係数と決定係数だけですか?どれくらい違うのでしょうかね。

私のやり方が間違っていたみたいで,やり直したらまったく同じ値になりました。どうもありがとうございました。

また疑問が出てきたのですが,
http://aoki2.si.gunma-u.ac.jp/LaTeX/SREG-QT1.html
↑に示されている標準偏回帰係数の求め方ですが,このページの方法だと平均はゼロになるのですが,分散が1になっていません。
どうすれば分散が1の標準偏回帰係数になるのでしょうか?
普通の数的データなら,平均値を引いたあとに標準偏差で割るのでしょうが,この場合はどうしたらいいのでしょうか?

     [このページのトップへ]


129. Re^4: 質的変数どうしの相関のようなもの?  名無しさん@日本  2001/01/05 (金) 12:09
> どうすれば分散が1の標準偏回帰係数になるのでしょうか?

過去ログ(nobody さんの発言)から一部修正のうえ引用します。

> 重回帰分析において,標準化偏回帰係数は
> 偏回帰係数 b1,b2,独立変数の標準偏差s1,s2,従属変数の標準偏差 sy,
> 標準化偏回帰係数β1,β2 などとします。
> β1=b1*s1/sy
> β2=b2*s2/sy
>  :
> です。

上の記述で,独立変数とあるところを,ダミー変数と読み替えればいいのです。
ダミー変数の時点でこれにより標準化偏回帰係数を求めましょう。
この時点ではアイテム変数単位での平均値は0になっていませんから,その後で,定数項調整により平均値を0にするといいでしょう。
っていうか,どのダミー変数が効いているかを標準化偏回帰係数で評価するのが目的ならば,アイテム変数単位で平均値を0にする必要はありません。

     [このページのトップへ]


130. Re^5: 質的変数どうしの相関のようなもの?  名無しさん@日本  2001/01/05 (金) 12:10
> どうすれば分散が1の標準偏回帰係数になるのでしょうか?

あなたの見ているページ
http://aoki2.si.gunma-u.ac.jp/LaTeX/SREG-QT1.html
の中程に,重回帰分析で分析した結果が示されているが,その中の「★ 偏回帰係数など」という表の右端の欄「標準化偏回帰係数」がそれですよ。

表3のデータ例で,Y の標準偏差が 852.22167360,D12 の標準偏差が 0.41403933561 で,D12 の偏回帰係数が 517.3333,したがって,
標準化偏回帰係数 =517.3333*0.41403933561/852.22167360
         = 0.25133875664
などなどです。

     [このページのトップへ]


143. Re^6: 質的変数どうしの相関のようなもの?  カイセキ  2001/01/07 (日) 03:14
> > どうすれば分散が1の標準偏回帰係数になるのでしょうか?
>
> あなたの見ているページ
> http://aoki2.si.gunma-u.ac.jp/LaTeX/SREG-QT1.html
> の中程に,重回帰分析で分析した結果が示されているが,その中の「★ 偏回帰係数など」という表の右端の欄「標準化偏回帰係数」がそれですよ。
>
> 表3のデータ例で,Y の標準偏差が 852.22167360,D12 の標準偏差が 0.41403933561 で,D12 の偏回帰係数が 517.3333,したがって,
> 標準化偏回帰係数 =517.3333*0.41403933561/852.22167360
>          = 0.25133875664
> などなどです。

理解できました。ありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 012 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る