はじめまして。
今,膨大なデータを前に,ちょっとクラクラきてます。
分析をする前に,いろいろ変数間の関係を見てみようという目的で,散布図を調べていると,変な形になりました。
Y=症状有訴変化数 contiuous data(-15から+15)
X=被害の程度 discrete data(0=被害無から3=被害最大)
で,
15 *
10 * *
5 * * *
0 * * * *
-5 * * *
-10 *
-15
......0...1...2...3
("*"がプロットです )
かなり簡略ですが,このような散布図になりました。
どのように解釈すべきかちょっと迷っています。
被害のなかった人は,有訴数変化はほとんどなく,被害が大きかった人では有訴数が増えた人もいれば減った人もいるようです。
このような場合,被害最大群のみ抽出して,有訴数変化をもたらした変数を見ていくべきでしょうか?X変数は,被害無(N=60),一部被害(N=410)被害小(N=900)被害最大(N=4700)とグループ間でかなりN数が異なるので,グループ間の比較は,妥当性があるかちょっと?です。
参考文献などもありましたら教えてください。よろしくお願いいたします。