★ クラスタ分析 ★

7282. クラスタ分析 近藤 2005/07/26 (火) 11:53
└7283. Re: クラスタ分析 青木繁伸 2005/07/26 (火) 12:34
 └7284. Re^2: クラスタ分析 近藤 2005/07/26 (火) 13:12
  └7291. Re^3: クラスタ分析 kzkishi 2005/07/27 (水) 10:56
   └7303. Re^4: クラスタ分析 近藤 2005/07/28 (木) 19:17
    └7304. Re^5: クラスタ分析 kzkishi 2005/07/28 (木) 20:11


7282. クラスタ分析 近藤  2005/07/26 (火) 11:53
現在,従業員の
時系列心理負荷データ(数値)をクラスタ分析をしようして
各々従業員に対する負荷状況の予測したいと思っています。

ただし,要望として
負荷状況がなくなっている人には,少なくなる予測を
負荷状況が高くなっている人には,高くなる予測を
行わないといけません


質問として
 (1)上記要件に対する実現方法が,クラスタ分析からの予測が最適なのか?
  (他に,よい方法があるのか?)

 (2)上記要件を開発(コーディング)するのに,参考となるWebサイトや参考文献などを教えて頂きたい。

 (3)上記要件を実現するのに,使用できるパッケージ(モジュールで使用を前提)がないのか?
  (なにぶん,お金がないプロジェクトなので安価が希望です)

です。

申し訳ありませんが,ご助力宜しくお願いします。

     [このページのトップへ]


7283. Re: クラスタ分析 青木繁伸  2005/07/26 (火) 12:34
なぜクラスター分析なのですか?

> 負荷状況がなくなっている人には,少なくなる予測を
> 負荷状況が高くなっている人には,高くなる予測を
> 行わないといけません

重回帰か何かではだめなんですか?

     [このページのトップへ]


7284. Re^2: クラスタ分析 近藤  2005/07/26 (火) 13:12
> 重回帰か何かではだめなんですか?

プールされた,データの経年変化(事業所特性と個人特性)に
基づいて算出しようとしたので
クラスター分析がいいのかと思ったのですが…。
(すいません,この分野の知識は薄いです。)


     [このページのトップへ]


7291. Re^3: クラスタ分析 kzkishi  2005/07/27 (水) 10:56
>プールされた,データの経年変化(事業所特性と個人特性)に基づいて算出しようとしたので

経時変化だからクラスタ分析,というのは変な気がします。
負荷状況の予測を行う際に想定されるモデルとして,
・心理負荷データは幾つかの群に分類できる。
・それらの群間では負荷状況が異なる。
という2つの前提が成り立っていると仮定しているからクラスタ分析による予測なのでは?

事業所特性と個人特性という単語の意味が理解できなかったのですが,事業所ごとに1つの群とみなして分析を進めるのはクラスタ分析ではありませんよ?(失礼な質問ですが,根本的な勘違いを避けたいので)

予測を行う手法の選択では,上に述べたようなモデルをどう想定するか,が問題かと思います。
負荷状況は心理負荷データの線形和で説明できる,と仮定すると,重回帰分析ですね。
予測する負荷状況というのが連続変数でないなら,数量化法かも知れませんが。
負荷の有無,という「0か1か」的な予測だと,最近の流行りはSVMという識別器でしょうか。

いづれにせよ,最も安価なのはRでしょうね(と言いつつ私は使ったことがありませんが)。

     [このページのトップへ]


7303. Re^4: クラスタ分析 近藤  2005/07/28 (木) 19:17
> 経時変化だからクラスタ分析,というのは変な気がします。
> 負荷状況の予測を行う際に想定されるモデルとして,
> ・心理負荷データは幾つかの群に分類できる。
> ・それらの群間では負荷状況が異なる。
> という2つの前提が成り立っていると仮定しているからクラスタ分析による予測なのでは?

ご返信ありがとうございます。

なぜ,クラスタ分析なのかといいますと
 ユーザ様からのご要望で,心理負荷データを以下の分類にわけたいとの
 ご要望がありました。

 ・心理ストレス異常群
 ・心理ストレス回復群
 ・心理ストレス異常予備群
 ・心理ストレス正常群

この分類わけをするには,クラスタ分析なのかなと
思っていたからです。

説明不足で,申し訳ありません。


> 事業所特性と個人特性という単語の意味が理解できなかったのですが,事業所ごとに1つの群とみなして分析を進めるのはクラスタ分析ではありませんよ?(失礼な質問ですが,根本的な勘違いを避けたいので)

事業所特性というのは,
事業所毎にプールされたデータから,予測を導き出す
という事で事業所特性と言う意味になります。

事業所データ毎に,クラスタ分析を行うという意味です。

> 予測を行う手法の選択では,上に述べたようなモデルをどう想定するか,が問題かと思います。
> 負荷状況は心理負荷データの線形和で説明できる,と仮定すると,重回帰分析ですね。
> 予測する負荷状況というのが連続変数でないなら,数量化法かも知れませんが。
> 負荷の有無,という「0か1か」的な予測だと,最近の流行りはSVMという識別器でしょうか。

申し訳ありません
勉強不足なので調べてみます。

> いづれにせよ,最も安価なのはRでしょうね(と言いつつ私は使ったことがありませんが)。

R?というソフトがあるのでしょうか?

     [このページのトップへ]


7304. Re^5: クラスタ分析 kzkishi  2005/07/28 (木) 20:11
>ユーザ様からのご要望で,心理負荷データを以下の分類にわけたいとの

失礼,勘違いをしていました。
各個人の負荷状況は前もって判っていないのですね。
上で私がおすすめした内容は忘れて下さい。

教師なし学習でしたら,確かにメジャーなのはクラスタ分析だと思います。
4分類にしたいのなら,階層的クラスタリングでしょうか。
マイナーなところではSOMというものもありますが…。

>事業所データ毎に,クラスタ分析を行うという意味です。

理解できました。
失礼いたしました。

>R?というソフトがあるのでしょうか?

GPLオープンソースのフリーソフトです。
当初の投稿質問にあった,参考サイトなども含めて
http://cran.r-project.org/
をどうぞ。
本体は「R Homepage」,参考サイト等は「Packages」というリンクを辿れば見つかるでしょう。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 034 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る