★ ロジスティック回帰分析→得点表 ★

2177. ロジスティック回帰分析→得点表 ぽぽろん 2004/02/02 (月) 22:35
└2180. Re: ロジスティック回帰分析→得点表 sb812109 2004/02/03 (火) 08:28
 └2193. 得点表(ご教授ください) ぽぽろん 2004/02/03 (火) 16:48
  ├2202. Re: 得点表(ご教授ください) sb812109 2004/02/03 (火) 20:32
  │└2216. Re^2: 得点表(ご教授ください) ぽぽろん 2004/02/04 (水) 13:39
  │ └2225. Re^3: 得点表(ご教授ください) sb812109 2004/02/04 (水) 19:12
  │  └2242. Re^4: 得点表(ご教授ください) ぽぽろん 2004/02/06 (金) 12:36
  └2201. Re: 得点表(ご教授ください) TY 2004/02/03 (火) 20:14
   └2206. Re^2: 得点表(ご教授ください) HC 2004/02/03 (火) 23:35


2177. ロジスティック回帰分析→得点表 ぽぽろん  2004/02/02 (月) 22:35
某企業の管理部門に所属しています。
標題の件でアドバイス頂けないでしょうか。

今,当社の営業社員をより良い営業活動へ導くための得点表を作ろうとしています。
良い営業活動とは,顧客獲得につながる営業活動という意味です。
営業社員は各自,潜在顧客に対して様々な営業活動を行い,その結果として顧客獲得に「失敗」か「成功」します。
この点,モデルは2値の応答変数をもっており,説明変数は各営業活動の種類になります。説明変数は全て名義尺度ないし順序尺度で,それぞれ2〜10程度の水準をもっています。
要は,過去の営業行動と顧客獲得実績との関係をモデル化して,これからの営業社員の行動を直接評価し,これによって社員の「良い行動」を誘発したい・・。と考えているのです。
教えて頂きたいのは以下の点です。
(前提として,ダミー変数の作り方,変数選択方法など基本的なことだけ理解しております)

1,ロジスティック回帰分析のアウトプットをどのように利用して得点化したらよいか?
 - 説明変数に0,1をあてた後の回帰係数の総和を,その社員の得点とするのは正しいか。
 - あるいはEXP(回帰係数)などの変換を行わなければ,正しい得点にならないのか。
2,もっと使いやすい得点表にするにはどうしたらよいか?
 - 1で得られた得点をさらに変換して,0〜100点の間に分布させることはできないか。
 - この際,当初の得点が持っている順序や意味をできる限り失わないためには何に注意したらよいか。
3,その他で注意しなければならないことは何か。

また,今回,私がやろうとしていることは,クレジット会社が使っている「スコアカード」の発想に近いと思っています。そこでこの文献をあたってみたのですが,具体的な作成方法を見つけることはできませんでした。何か良い文献があれば教えてください。

長くなってしまいましたが,何卒,ご教授おねがいいたします。

     [このページのトップへ]


2180. Re: ロジスティック回帰分析→得点表 sb812109  2004/02/03 (火) 08:28
説明変数が2つx1,x2があるとします。ロジスティック回帰分析より,

   Z=β0+β1*x1+β2*x2

の3つパラメータβ0,β1,β2が出力されます。この推定されたパラメータを用いてある営業部員が1である確率pは,次のようになります。

   p=1/ (1+exp(-z))

pは,営業部員が1である確率ですので,0〜1の間に分布します。

この確率をあるcut-off値(例えば0.5)で区切って0か1かに変換します。
2X2分割表を作るとモデルがどの程度当てはまりがいいか悪いかが判ります。

     [このページのトップへ]


2193. 得点表(ご教授ください) ぽぽろん  2004/02/03 (火) 16:48
> 説明変数が2つx1,x2があるとします。ロジスティック回帰分析より,
>
>    Z=β0+β1*x1+β2*x2
>
> の3つパラメータβ0,β1,β2が出力されます。この推定されたパラメータを用いてある営業部員が1である確率pは,次のようになります。
>
>    p=1/ (1+exp(-z))
>
> pは,営業部員が1である確率ですので,0〜1の間に分布します。
>
> この確率をあるcut-off値(例えば0.5)で区切って0か1かに変換します。
> 2X2分割表を作るとモデルがどの程度当てはまりがいいか悪いかが判ります。

ご回答ありがとうございます。
私がアドバイスを頂きたいのは主に,パラメータ推定値を得点として利用する方法についてなのですが,これについてはどうでしょうか?(わかりにくい質問で申し訳ありませんでした)
たとえば,係数を直接得点とみなすとか,あるいはオッズ比に変換したあとに加工するとか,そういった類いの方法についてです。
スコア最終化のイメージは以下のようなものです。
営業社員がその潜在顧客の趣味を把握している→10点
営業社員がその潜在顧客の誕生日を知っている→5点
営業社員がその潜在顧客の・・・
・・・・・
合計:75点

実際,クレジット会社はこのような方法で算出された得点をローン決裁に利用しているとききます。これらの得点は,将来の良,不良のオッズと直接にリンクしているとききます。
つまり,私がやりたいことは,今の営業社員の行動が将来の顧客獲得にどれだけ貢献しているかを得点で示したいということなのです。もし分かればご教授いただけないでしょうか。

また,モデルの当てはめや,その尺度,回帰診断については文献をみればわかるので,この点は大丈夫です。

     [このページのトップへ]


2202. Re: 得点表(ご教授ください) sb812109  2004/02/03 (火) 20:32
学問的に正しいことと実用的に役に立つことを分けて考えましょう。

医学の分野でもスコアは結構使われています。新生児の生命予後を予測するアプガースコアは50年間も使用されています。しかし,その科学的根拠は?です。ただ,50年間使われていることでも判るように,実用的には充分役に立つものです。ロジスティック回帰分析の結果からスコアするには,いろんな方法があるでしょう。回帰係数を正規化してもいいでしょうし,オッズ比で表して一覧表にし,スコアを当てはめてもいいでしょうし,また,その分野に長けた人は,項目をみただけでスコアが浮かんでくるでしょう。
多分,どのスコアも実用的で役に立つものだと思います。文献が無いのは,学問的批判に耐えるものが無い為だと思いますが。

     [このページのトップへ]


2216. Re^2: 得点表(ご教授ください) ぽぽろん  2004/02/04 (水) 13:39
ご教授頂き,ありがとうございます。
(また,しつこく喰らいついて申し訳ありません)

>ロジスティック回帰分析の結果からスコアするには,いろんな方法があるでしょう。回帰係数を正規化してもいいでしょうし,オッズ比で表して一覧表にし,スコアを当てはめてもいいでしょうし,

きちんとしたスコアならこんな風になっているみたいです。

600点のオッズは,60:1(これがスケーリング基準)
PDO=20 (オッズを倍にするための加算点数)
したがって564点のオッズは,
60:1×2^((564-600)/20)=
17:1
私のような素人にとっては,スコア変換した際に順位を失わない方法はできますが,差の意味を失わない方法は,かなり難しいものです。
とりあえず,自分なりにいろいろ試してみますが,行き詰まった時には,またお助けください。

> 多分,どのスコアも実用的で役に立つものだと思います。文献が無いのは,学問的批判に耐えるものが無い為だと思いますが。

http://www.fairisaac.com
文献が無いのは,こういう会社の内部で蓄積されたノウハウが出回ってしまうと,商売が成立しなくなってしまうで研究者に出版の制限があるからなのかなぁと思いました。
(学問的な正しさは,私にはとても評価できません)

     [このページのトップへ]


2225. Re^3: 得点表(ご教授ください) sb812109  2004/02/04 (水) 19:12
(1)心臓血管外科系手術の生命予後を予測するEuroscoreと云うものがあります。統計解析からスコアの決定まで論文が発表されていますので参考にされては如何でしょうか。

http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed

     [このページのトップへ]


2242. Re^4: 得点表(ご教授ください) ぽぽろん  2004/02/06 (金) 12:36
sb812109様
ありがとうございます。
ざっとHPを閲覧しましたが,参考になる情報がたくさんあるようです。
助かります。本当にありがとうございました。

     [このページのトップへ]


2201. Re: 得点表(ご教授ください) TY  2004/02/03 (火) 20:14
「Propensity score」が求めるものではないでしょうか。ただし,これで検索しても応用事例ばっかり引っかかって,定義を簡潔に述べたものに行き着くのは至難かもしれません。

     [このページのトップへ]


2206. Re^2: 得点表(ご教授ください) HC  2004/02/03 (火) 23:35
> 「Propensity score」が求めるものではないでしょうか。ただし,これで検索しても応用事例ばっかり引っかかって,定義を簡潔に述べたものに行き着くのは至難かもしれません。

たんなる,

> p=1/ (1+exp(-z))

ですよね?
傾向性=計算された「1」をとる確率.

---
<sb812109 2004/02/03 (火) 08:28>

説明変数が2つx1,x2があるとします。ロジスティック回帰分析より,

   Z=β0+β1*x1+β2*x2

の3つパラメータβ0,β1,β2が出力されます。この推定されたパラメータを用いてある営業部員が1である確率pは,次のようになります。

   p=1/ (1+exp(-z))

pは,営業部員が1である確率ですので,0〜1の間に分布します。
---

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 027 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る