No.00695 Re: 判別分析による家電の状態推定 【Hiro】 2006/07/22(Sat) 17:52
補足します。
判別したい郡は3郡以上で,判別分析には正準判別分析を行なうつもりです。
No.00696 Re: 判別分析による家電の状態推定 【青木繁伸】 2006/07/22(Sat) 18:09
・説明変量が正規分布に沿っていない場合,判別分析は利用すべきではないのか?
原則的にはそうでしょう。
実際的には程度問題でしょう。
その境界がどこにあるかは,一概には言えないでしょう。
・どの程度正規分布にそっていればよい,といった指標はあるのか?
上を参照。
・ 説明変量が正規分布にそっているか調べる場合,群毎に調べるのか,全ての郡を合わせて調べるのか?(つまり,OFF状態で得られた電圧データ100個と, ON状態で得られた電圧データ100個に関して,個別に正規確率を調べるべきなのか,合わせて200個のデータとして正規確率を調べるべきなのか,という ことです)
個別,あるいは平均値(と,場合によっては標準偏差をも)を調整したデータでということになるかもしれませんね。
・説明変量間で単位が違う場合(ワット,ボルト,アンペア,%),データは標準化したほうが良いのか?
こ の操作は内部で行われます。というか,判別はそのままの値で行い,影響力などの情報を得るためにはプログラム内で行われ,標準化判別係数の形で出力される こともあるでしょう(プログラムによっては計算されないので,そのような場合には自分でデータを標準化した場合について計算を行ってみてください。正判別 率については,同じ結果になると思います。だって,そうじゃないと,最適な単位系が何かを探さなくてはならなくなります(メートルで表すかミリで表すかみ たいなことになるわけです。。。無意味ですよね))。
・時系列データは自己相関が強い,と聞きますがそれは判別分析の結果の妥当性に影響を与えるのか?
与えるでしょうね。
重回帰分析でいえば,多重共線性ということになります。
変数選択を行って,問題のない解を求めることが望まれることでしょう。
・今回は説明変量間で,電力=電圧*電流*力率 の関係が成り立つが,これは判別分析の結果に影響を及ぼすか?(説明変量は3つにすべきか?)
線形結合なら明らかに多重共線性が成り立ちますが,掛算の関係なら明確には成り立たないでしょう。
しかし,相関関係はかなり高いと思われるので,問題になると予想されます。
実際にやってみて判断しないとどうとも言えないとは思いますが。
・その他,注意すべき点はあるか?
他のコメンテータの方,よろしくお願いします
No.00718 Re: 判別分析による家電の状態推定 【Hiro】 2006/07/24(Mon) 21:15
丁寧な返信,有難うございます。
説明変量の正規性,相関性あたりに注意しながら実験を続けたいと思います。
有難うございました。
No.00719 Re: 判別分析による家電の状態推定 【K.Hiro】 2006/07/25(Tue) 07:49
他のコメンテータとして,
無意味な統計解析は止めましょう。
「・今回は説明変量間で,電力=電圧*電流*力率 の関係が成り立つが,」
固有技術で説明がつき,かつそれは相当古くから使われている関係であるものを
わざわざ統計解析を用いて,これを各要因に対して分析する意味があるのでしょうか?
統計手法の乱用と思います。
No.00720 Re: 判別分析による家電の状態推定 【通りすがり】 2006/07/25(Tue) 11:13
>「・今回は説明変量間で,電力=電圧*電流*力率 の関係が成り立つが,」
>固有技術で説明がつき,かつそれは相当古くから使われている関係であるものを
>わざわざ統計解析を用いて,これを各要因に対して分析する意味があるのでしょうか?
電 力を電圧,電流,力率から推定するのではなくて,あくまで推定対象は家電の状態なのですから,それが多少なりとも確率的な挙動を示すなら,統計解析を用い る意味はあるでしょう(仮に電力を推定する事態でもノイズが入るだろうから,統計的に解析する意味はないとは言えないと思いますけど)。
それはそうと,何に使われようとしているのかが気になる・・・^^;
炊飯器なら炊飯中,保温中,電源オフを電圧等のパラメータから判別しよう,ということなのかな?
● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る