No.01998 「好き」と「嫌い」というデータの解析  【初心者T】 2006/12/22(Fri) 21:00

はじめまして。
統計学に関して初心者であまりよくわかってないので教えていただけたら幸いです。
(xa1,ya1)(xa2,ya2)(xa3,ya3),・・・・・・,(xaN,yaN)というAデータと,
(xb1,yb1)(xb2,yb2)(xb3,yb3),・・・・・・,(xbN,ybN)というBデータがとれたとします。
AとBは相反する意味を持ったのデータで,
Aは被験者が「好き」と答えたデータ
Bは被験者が「嫌い」と答えたデータ
だったとします。
この時,「好き」と答える傾向(xとyの傾向)を求めたいです。
普 通,「好き」と答えたAデータのみを最小二乗法にて回帰直線を求めれば良いと思うのですが,得られたデータには偏りがあったり,またデータ数が多いとは言 えない状況です。例えば,「好き」というデータがたくさん集まっているポイントがあっても,それ以上に「嫌い」というデータがあれば,そのポイントはあま り好まれないポイントとなると思うのです。
なので,「嫌い」と答えたBデータも考慮したいのですが,最小二乗法では一つの種類の要素しか対象としていないようなので,どうすれば良いのでしょうか?
何か方法があればご教授頂ければ幸いです。
(説明がヘタクソで本当にすみません)

No.01999 Re: 「好き」と「嫌い」というデータの解析  【青木繁伸】 2006/12/22(Fri) 21:12

    グレード1 グレード2  … グレードn
好き群
嫌い群
みたいなデータですか?
グレードが間隔尺度以上なら直線回帰でいいでしょうし
グレードが順序尺度ならコクラン・アーミテージ検定ではいかがでしょうか。

No.02000 Re: 「好き」と「嫌い」というデータの解析  【初心者T】 2006/12/22(Fri) 21:30

僕の説明がヘタクソで本当にすみません。
たぶんご理解頂けてないと思いますので,もう少し付け加えます。
例えば,「ケーキ」についての話だったとします。
xが砂糖の量です。
yが生クリームの量です。
いろんなケーキを何人もの被験者に食べてもらって,
ケーキにおける砂糖と生クリームの関係を調べたいです。
そのケーキを食べた時に被験者は「好き」「嫌い」を各々発言していった結果,
砂糖xに対する生クリームyのベストな量を求めたいです。

ご理解いただけたでしょうか?
よろしくお願いします。

No.02001 Re: 「好き」と「嫌い」というデータの解析  【青木繁伸】 2006/12/22(Fri) 21:33

ウソの数字で良いですから,実際に近い形でデータを見せて頂けませんか。
申し訳ないけど,よく分からないのです。
よく分かる方,いらっしゃいましたら,早めに回答をお願いします。

No.02002 Re: 「好き」と「嫌い」というデータの解析  【初心者T】 2006/12/22(Fri) 22:04

本当にごめんなさい(泣)
お待たせしました。次のようなデータです。

「好き」
砂糖の量(g) 生クリームの量(g)
20 40
30 70
40 60
50 80
60 50
70 70
80 70
90 90
26 45
38 76
42 63
59 89
63 58
67 80
85 90
80 87
32 114
38 107
31 118
34 105

「嫌い」
砂糖の量(g) 生クリームの量(g)
20 30
30 25
40 55
50 60
60 30
70 50
80 55
90 100
26 70
38 85
42 88
59 96
63 40
67 90
85 95
80 110
26 80
38 85
42 93
59 120
63 20
67 100
85 40
80 50
36 110
31 107
36 118
37 105
28 116
32 106
33 111
34 112
37 110
27 105

No.02003 Re: 「好き」と「嫌い」というデータの解析  【初心者T】 2006/12/22(Fri) 22:05

見にくくなってしまいました。右の数字が生クリームの方です。

No.02004 Re: 「好き」と「嫌い」というデータの解析  【初心者T】 2006/12/22(Fri) 22:19

「好き」だけで回帰直線を引くと,
砂糖30g生クリーム110gあたりにある点に引っ張られると思いますが,
砂糖30g生クリーム110gあたりには「嫌い」の点がたくさんあります。
なので,「嫌い」も考慮して直線を出した方が良いと考えました。

No.02006 Re: 「好き」と「嫌い」というデータの解析  【青木繁伸】 2006/12/22(Fri) 22:34

好き,と,嫌いが,砂糖と生クリームの量で判別できるかということではいかがでしょうか?

つまり,判別分析。

二変数の場合なら,ある直線を引いて,それより上なら好き,下なら嫌い,というように分かれるかどうかと言うことでしょう。

示されたデータはかなりぐっちゃりしてますね。赤は「好き」,黒が「嫌い」

fig


No.02007 Re: 「好き」と「嫌い」というデータの解析  【初心者T】 2006/12/22(Fri) 22:40

なるほど,判別分析ですね!
示したデータは「嫌い」の間に「好き」が挟まれている形になっています。
なので,2つの直線を引いて判別分析していけば良いのですかね??

No.02008 Re: 「好き」と「嫌い」というデータの解析  【初心者T】 2006/12/22(Fri) 22:56

いや,まず判別分析をちゃんと勉強してみます。
青木先生,
こんな分かりにくい説明をご理解して頂き,本当に有難うございました!!

No.02009 Re: 「好き」と「嫌い」というデータの解析  【青木繁伸】 2006/12/22(Fri) 23:00

> 2つの直線を引いて判別分析していけば良いのですかね

散布図を見れば,どんな判別境界を取ればよいか,いろいろ示唆は得られるのでしょうが,「2つの直線を引いて判別分析していけば良いのですかね」というのは,理論的な裏付けがないでしょう。
極端なことを言えば任意の曲線をフリーハンドで描くなんてことまでいってしまう可能性もあるわけで,それはいかになんでも。。。。

今回のデータは,一般的には,判別不能とするほうが良さそうに思えますがどうでしょう。

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る