No.13848 重回帰分析 目的変数がノンパラメトリック  【ゆうた】 2010/11/24(Wed) 16:21

はじめまして,青木先生。

重回帰分析について質問があります。

重回帰分析では,説明変数は質的データ(ダミー変数にして),量的データの両方を用いることができ,目的変数は量的データを用いるんですよね。

そのときに,目的変数の量的データが正規分布していない場合は,重回帰分析をもちいることができるのでしょうか?

No.13849 Re: 重回帰分析 目的変数がノンパラメトリック  【青木繁伸】 2010/11/24(Wed) 17:23

glm を使うことになるでしょう

No.13850 Re: 重回帰分析 目的変数がノンパラメトリック  【ゆうた】 2010/11/24(Wed) 18:32

返答ありがとうございます。
glmというのを初めて聞きました。なので調べてみました。
glmというものは,説明変数は,質的変数か量的変数,もしくは両方が複数ある。そして,目的変数が量的変数で正規分布していない。そんなときに使用する,多変量分析といった理解でよろしいでしょうか?
glmとは「general linear model(一般線形モデル)」や「generalized linear model(一般化線形モデル)」のことでしょうか??それともほかのものがあるのでしょうか?
再び質問をしてしまってすみません。

No.13858 Re: 重回帰分析 目的変数がノンパラメトリック  【青木繁伸】 2010/11/24(Wed) 23:00

ふむふむ
glm is used to fit generalized linear models, specified by giving a symbolic description of the linear predictor and a description of the error distribution.
ですね。

No.13862 Generalized Linear Model一般化線形モデル  【ゆうた】 2010/11/25(Thu) 03:58

Generalized Linear Model一般化線形モデルについてさらに学習してみました。

Generalized Linear Model一般化線形モデルは簡単にまとめると以下のような特徴があるんですね。

1.正規分布でないような広範囲のデータを扱うことができる。
 つまり,説明変数も目的変数もどんな尺度(名義尺度,順序尺度,間隔尺度,比尺度)で も使用が可能である。

2.複数の説明変数のうち,どれが目的変数の予測・説明に寄与しているのか,また指定し  た説明変数で,どれだけ目的変数の説明ができているかを知ることができる。

GLMを行うときは,

1.目的変数を決める。
2.その目的変数の分布を指定する。 
  分布の選定の参考基準として
  連続変数なら正規分布
  度数または2水準の確立変数なら二項分布
  度数ならpoisson分布
  正の連続量なら指数分布 
  などがある。
3.リンク関数を指定する。
  指定の参考基準として
  正規分布なら恒等 g(μ) = μ
  二項分布ならロジット
  poisson分布なら対数 g(μ) = log(μ)
  指数分布なら逆数
  などがある。

それで分析を行う。 

この理解でよろしいでしょうか?

そして,目的変数の量的データが正規分布していない場合は,分布の指定ではどの分布を指定したらよろしいのでしょうか? 

その目的変数は以下のような分布です。

平均 4.4
標準偏差 1.1
分位点
100.0% 最大値 5
75.0% 4分位点 5
50.0% 中央値 5
25.0% 4分位点 4
0.0% 最小値 0

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る