No.04067 重回帰分析について  【Shimo】 2007/08/04(Sat) 01:19

下記のようなモデル式を考えているのですが,式の変形等により重回帰で分析できるのでしょうか?

Y=aX1*(bX2+cX3+dX4+・・・+e)

ようはある要因(X1)は他の要因に対して一律に影響する(例えば週末は売り上げが2倍になるが,売り上げ自体は来店客数や店舗面積等による加法モデル)モデルの分析をしたいと思っているのですが。

以上宜しくお願いいたします。

No.04068 Re: 重回帰分析について  【青木繁伸】 2007/08/04(Sat) 07:57

y=a(bx1x2+cx1x3+dx1*x4+…+e) ですから,前もって x2,x3,x4,... に x1 を掛けておいてそれを使って普通に重回帰分析をすればよいでしょう。得られる係数は ab, ac, ad,... となり,a が分離できないですが,それはもともと分離できないものでしょう(というか,分離しても意味がない)。

No.04069 Re: 重回帰分析について  【Shimo】 2007/08/04(Sat) 09:47

回答ありがとうございます。

私も最初そのように考えていたのですが,仮に(すいません重回帰というよりは数量化I類ですね)
Y=売り上げ X1=曜日 X2=所在エリア X3=来店客数 X4=店舗面積
として,曜日による売り上げへの影響が一定の掛け率(係数a)ではないかというモデルなので,係数aを分離したいと考えたのです。

また数値データではなくカテゴリデータの場合は,前もって x2,x3,x4,... に x1 を掛けると1つのアイテムのカテゴリー数が膨大になるので,これも各カテゴリーのデータ(サンプル)数が減少するので具合が悪いと思ったのですが・・・・

No.04070 Re: 重回帰分析について  【青木繁伸】 2007/08/04(Sat) 12:40

> Y=売り上げ X1=曜日 X2=所在エリア X3=来店客数 X4=店舗面積
> として,曜日による売り上げへの影響が一定の掛け率(係数a)ではないか

曜日にどのような数値を割り当てるつもりですか??まさか1~7じゃないですよね

> 数値データではなくカテゴリデータの場合は,前もって x2,x3,x4,... に x1 を掛けると1つのアイテムのカテゴリー数が膨大になるので,これも各カテゴリーのデータ(サンプル)数が減少するので具合が悪い

データの都合で分析法を限定してはいけませんね
適用すべき手法でデータ不足なら,データを増やすべきです

なお,カテゴリーデータの扱いについては,ダミー変数を使えばよいだけで,数量化I類というのはダミー編巣を使った重回帰分析と全く同じです。

どうしても得心がいかないということであれば,Y=aX1*(bX2+cX3+dX4+・・・+e) のまま,非線形最小二乗法(このモデルは非線形ではないけど)で係数を推定して見られると良いと思います。Excelのソルバーを使えばよいでしょう。

でも,結局のところ,曜日にどのような数値を与えるか(X1をどのように取り扱うか)がクリティカル・ポイントでしょうね。

No.04071 Re: 重回帰分析について  【Shimo】 2007/08/04(Sat) 19:15

回答有難うございます。

> 曜日にどのような数値を割り当てるつもりですか??まさか1~7じゃないですよね

>なお,カテゴリーデータの扱いについては,ダミー変数を使えばよいだけで,数量化I類というのはダミー編巣を使った重回帰分析と全く同じです。

すいません,1類はダミー変数を使うだけで原理は重回帰と同じ点は理解していたのですが,その場合に曜日に1−7を割り当てるのは問題があるのでしょうか?
ただ,前もって x2,x3,x4,... に x1 を掛ける場合には,問題があるというか,カテゴリーデータ同士を掛けるという部分がいまひとつ理解できない感じもします。

またエクセルのソルバーを使う方法は試してみようと思いますが,そもそも,例えば他の要因から独立して曜日要因による売り上げへの影響が一定の掛け率(係数a)のような場合にはどのような解析方法が考えられるのでしょうか?

No.04072 Re: 重回帰分析について  【青木繁伸】 2007/08/04(Sat) 21:38

> その場合に曜日に1−7を割り当てるのは問題があるのでしょうか

1-7を与えても良いですが,その後,実際にはどう処理されるのでしょうか

分析に使用するプログラムが6つのダミー変数を生成して適正に分析されるのでしょうか??

Y=aX1*(bX2+cX3+dX4+・・・+e)
で,x1が1~7では,あなたの意図を反映しない分析結果になるでしょう(って,釈迦に説法か)
> カテゴリーデータ同士を掛けるという部分がいまひとつ理解できない

ここが,逆に私には理解できない

X1 が曜日だとすると,曜日を表すダミー変数は6つになり,結局それは,
y = 月曜*(b1*x2+c1*x3+...)+火曜*(b2*x2+c2*x3+...)+土曜*(b6*x2+c6*x3+...)
みたいになるのでは?要するに,月曜日はこの予測式,火曜日はまた別の予測式,,,

> 例えば他の要因から独立して曜日要因による売り上げへの影響が一定の掛け率(係数a)のような場合には

これがモデルにちゃんと反映されているのでしょうか??「他の要因から独立して」というのは,本当に成り立つのでしょうか?(まあ,それを確かめたいと言うことかも知れないが)

No.04073 Re: 重回帰分析について  【Shimo】 2007/08/05(Sun) 00:46

返信有難うございます。

> Y=aX1*(bX2+cX3+dX4+・・・+e)
で,x1が1~7では,あなたの意図を反映しない分析結果になるでしょう(って,釈迦に説法か)

通 常の1類の加法モデル,Y=aX1+bX2+cX3+dX4+・・・+eでは,x1に1-7のダミー変数を生成して解析すると思うのですが,Y=aX1* (bX2・・のように乗法が入っている場合はおかしなことになるということでしょうか?(すいません専門的に統計学を学習していないので,変な質問かも知 れませんが,多変量解析は行列式の計算なので乗法が入っていると,ダミー変数が使用できないということなんでしょうか?)

また
> y = 月曜*(b1*x2+c1*x3+...)+火曜*(b2*x2+c2*x3+...)+土曜*(b6*x2+c6*x3+...)

というよりは,
月曜の売上=月曜*(b1*x2+c1*x3+...)
火曜の売上=火曜*(b1*x2+c1*x3+...)
という具合に,曜日以外の要因の売上への影響度は一定ということを仮定していました。おっしゃるとおりに他の要因から独立してというのが本当に成り立つのかも確かめたいということなんです。

とりあえずは曜日別に分けて,1類で分析を行ってみるか,先ほどのソルバーを使用してみようかと考えてます。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る