★ 回帰木の枝狩りのエラーについて ★

8174. 回帰木の枝狩りのエラーについて tara 2005/11/02 (水) 19:29
└8180. Re: 回帰木の枝狩りのエラーについて kzkishi 2005/11/04 (金) 11:01
 └8181. Re^2: 回帰木の枝狩りのエラーについて tara 2005/11/04 (金) 16:11


8174. 回帰木の枝狩りのエラーについて tara  2005/11/02 (水) 19:29
回帰木(Regression Trees)を用いてモデル化を行っています。
事後枝狩り(reduced-error-pruning)は「終端ノードのエラーが減少していない場合,その終端ノードを刈る」事と認識しています。
分類木(Classification Trees)の場合,目的変数が「質的」である為エラーは一目瞭然ですが,回帰木の場合,目的変数が「量的」である為,何をエラーとしているのでしょうか。
ご存知の方がいらっしゃいましたら,よろしくお願いします。

     [このページのトップへ]


8180. Re: 回帰木の枝狩りのエラーについて kzkishi  2005/11/04 (金) 11:01
読みかじりの知識ですが…。

使っているアルゴリズムによって違うと思いますよ。

C4.5/5.0/see5.0ではルールベースの刈り込みを行うそうで,それだと

>「終端ノードのエラーが減少していない場合,その終端ノードを刈る」

という訳でもないようです(分岐に用いている変数同士をノード間で比較して刈り込み)。

他のアルゴリズムだったら,多くは分岐基準と同じ(というか逆)なのでは?
交差検証のデータで,ノード内の目的変数の分散が大きいものを刈り込み,ではないかと。

     [このページのトップへ]


8181. Re^2: 回帰木の枝狩りのエラーについて tara  2005/11/04 (金) 16:11
kzkishi様

返信ありがとうございます。

エラーは分散だろうという情報ありがとうございます。
自分でももうしばらくソースを読んで(フリーのツールを使っているので)調べてみたいと思います。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 035 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る