★ 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について ★

 178 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について  Y・H  2002/10/17 (木) 07:45
  179 Re: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について  青木繁伸  2002/10/17 (木) 09:16
   213 Re^2: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その4  Y・H  2002/10/20 (日) 15:10
    214 Re^3: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その4  青木繁伸  2002/10/20 (日) 16:28
     215 Re^4: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その4  青木繁伸  2002/10/20 (日) 16:28
   212 Re^2: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その3  Y・H  2002/10/20 (日) 15:06
   211 Re^2: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その2  Y・H  2002/10/20 (日) 14:55
   210 Re^2: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その1  Y・H  2002/10/20 (日) 14:50
    216 Re^3: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その1  青木繁伸  2002/10/20 (日) 16:30


178. 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について  Y・H  2002/10/17 (木) 07:45
現在,修士論文執筆のためSPSSで解析を行っている者です。変数値の再カテゴリ化について質問いたします。
年齢や入居期間を3つのカテゴリに分ける場合,ちょうど総ケース数の三分の1ずつに分けることが望ましいのでしょうか。もしそうであるならば,例えば,〜40歳,41〜60歳,60歳〜の3カテゴリに区分した場合に,現在私が解析しているデータでは,どうしても1つのカテゴリが総ケース数のほぼ過半数を占めてしまうのです。1の位に0や5といったキリのよい数字を用いる限りにおいて,3つのカテゴリのケース数に大きな偏りが出てしまうのです。カテゴリ間のケース数をそろえるために,〜43,44〜72,73〜のように区分するのは不自然だと思うのですが,このような場合はどうすればよろしいのでしょうか。初歩的な質問で申し訳ありませんが,どなたか教えていただけませんか。

     [このページのトップへ]


179. Re: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について  青木繁伸  2002/10/17 (木) 09:16
なんのために再カテゴリー化が必要なのかにもよるかもしれませんが

例数が等しくなくてはいけないような分析を行うなら,データを取るときに同数になるように取ることが必要です(検出力の面から言えば)。全体で900人のデータを取る(取れる)ときに,検出力が一番高くなるのは,3群同数(300人ずつ)ということです。

単に,3群間の比較をするというなら,例数は等しくなくてもいいでしょう。
では,どのように区分するかということですが,年齢などにおいては10歳刻みとか5歳刻みとか常識的な区分の方が無難でしょう。変なところで区切ると,どうしてそこで区切ったかと言う話に発展しそうなので。
また,データの分布を描いてみて二峰性とか三峰性ならばピークの中点で区切るとか言うこともありえますが。
また,そもそも連続するのだから,無理に分割するのではなくて,分割しなくてもよい分析方法をとるとかいろいろ手はあります。ま,クロス集計表として提示するときは何らかの分割が必要でしょうが,年齢を数量化理論で組み入れたいから分割しないといけないというなら,変わりに重回帰分析を使えばいかがでしょうかというようなことです。

     [このページのトップへ]


213. Re^2: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その4  Y・H  2002/10/20 (日) 15:10
以上のことから,(1)生活への不安がない人ほど主観的幸福感が高い。(2)自治会への満足度が高い人ほど主観的幸福感が高い。(3)宗教活動に熱心な人ほど主観的幸福感が高い。ということを示せたのでしょうか。取りあえず,主観的幸福感の規定因(重回帰分析)のパス図も描いてみました。
何分初心者なものですから,統計の初歩さえも理解しているとは申せません。統計的に随分と誤りがあるように思います。長々と書き連ねてしまいましたが,ご指導いただければ有り難く存じます。

     [このページのトップへ]


214. Re^3: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その4  青木繁伸  2002/10/20 (日) 16:28
> クロス表などで相関をみる際には,この年齢3分で問題はありませんか。

年齢とペアになる変数が名義尺度の場合以外なら,年齢をカテゴリー化する必要はないでしょう。
その変数が順位尺度なら順位相関係数を計算,間隔尺度以上ならピアソンの積率相関係数を計算すればでいいわけです。

> 次に,重回帰分析について質問があるのですが,Y「主観的幸福感」(5段階評価)を従属
変数としX1「自覚的健康度」…中略…X10「施設への愛着」を独立変数重回帰分析を行いました。

この後に,
> 年齢構成等の回答者の属性の「主観的幸福感」に対する寄与を検討しました。

> 属性の影響の検討に関しましては,一元配置分散分析でよろしいのでしょうか。

なぜ,前者は重回帰,後者は一元配置分散分析なのでしょうか?両方とも重回帰(名義尺度,順位尺度の変数は,必要ならダミー変数を使って)を行わないのでしょうか?いっぺんに片が付くと思いますが。

> 独立変数間の相関が小さい方が望ましいのですか。

望ましいというわけではないです。そもそも,独立変数間の相関が低いという自体の方が少ない。多重共線性が生じなければかまわないでしょう。

     [このページのトップへ]


215. Re^4: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その4  青木繁伸  2002/10/20 (日) 16:28
> 以上のことから,(1)生活への不安がない人ほど主観的幸福感が高い。(2)自治会への満足度
が高い人ほど主観的幸福感が高い。(3)宗教活動に熱心な人ほど主観的幸福感が高い。とい
うことを示せたのでしょうか。

分散分析や回帰係数の検定結果が有意だと言うことと,それが意味があるかは別問題です。
決定係数が0.482というのは,(その分野における評価基準はあるのかもしれないですが)ちょっと低すぎると思います。
標準化偏回帰係数の大きさが提示されていないので,それらについての判断ができませんが,これも,その数値の大きさを評価すべきです。

     [このページのトップへ]


212. Re^2: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その3  Y・H  2002/10/20 (日) 15:06
次に,年齢構成等の回答者の属性の「主観的幸福感」に対する寄与を検討しました。「主観的幸福感」を従属変数とし,「性別」(2カテゴリ)を独立変数とする一元配置分散分析,「主観的幸福感」を従属変数とし,「年齢」(〜69歳,70〜79歳,80歳〜の3カテゴリ)を独立変数とする一元配置分散分析,「主観的幸福感」を従属変数とし,「世帯型」(夫婦型と単身型の2カテ)を独立変数とする一元配置分散分析,「主観的幸福感」を従属変数とし,「家族交流」(有りと希薄の2カテゴリ)を独立変数とする一元配置分散分析を行いました。各々有意確率は0.250,0.787,0.620,0.490となり,影響は見られませんでした。(私なりに考えました)問題点:(1)属性の影響の検討に関しましては,一元配置分散分析でよろしいのでしょうか。分散の均一性は前もって検定していません。(2)重回帰分析では,独立変数間の相関が小さい方が望ましいのですか。「自治会への評価」と「宗教活動への参加」の相関係数は0.22(5%水準で有意),「生活の不安」と「自治会への評価」の相関係数は0.04(有意でない),「生活の不安」と「宗教活動への参加」の相関係数は0.08(有意でない)です。〈その4へ〉

     [このページのトップへ]


211. Re^2: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その2  Y・H  2002/10/20 (日) 14:55
X1「自覚的健康度」(4段階評価),X2「友達付き合いの程度」(4段階評価),X3「施設の行事への参加の程度」(5段階評価),X4「文化活動への参加の程度」(5段階評価),X5「宗教活動への参加の程度」(降順の5段階評価),X6「施設内の外出頻度」(5段階評価),X7「施設外への外出頻度」(5段階評価),X8「自治会への評価」(降順の5段階評価),X9「生活の不安」(降順の4段階評価),X10「施設への愛着」(4段階評価)を独立変数として,βの有意水準が5%以下であることを変数投入の打ち切り基準としたステップワイズ法による重回帰分析を行いました。その結果,「自治会への評価」,「生活の不安」,「宗教活動への参加」の3変数が「主観的幸福感」を有意に説明できました。これらの3変数を投入した回帰式において,決定係数は0.482と分散分析の結果1%水準で有意でした。個々の変数のβは,「生活の不安」が-0.288とt検定の結果が1%水準で有意であり,「自治会への評価」が-0.253,「宗教活動への参加」が-0.251とt検定の結果が共に5%水準で有意でした。
〈その3に続きます〉

     [このページのトップへ]


210. Re^2: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その1  Y・H  2002/10/20 (日) 14:50
青木先生,詳細なコメントをつけてくださり,本当にありがとうございます。
2年ほど前から先生のHPは大変参考にさせていただいております。植物の写真等も興味深く拝見しております。
さて,「年齢」は現在,〜69歳,70〜79歳,80歳〜の3カテゴリに区分しています。
それぞれ欠損値を除く総ケース数(119)の30.8%,42.7%,26.5%となっています。
「後期高齢者」などの根拠に基づく区分ではありませんが,1の位にキリのよい数字を用いる限りにおいて,
3つのカテゴリのケース数に大きな偏りが出ないようにするには,これしかありませんでした。
クロス表などで相関をみる際には,この年齢3分で問題はありませんか。
次に,重回帰分析について質問があるのですが,Y「主観的幸福感」(5段階評価)を従属変数とし,

〈その2に続きます〉

     [このページのトップへ]


216. Re^3: 連続する変数をを3つのカテゴリに分ける場合(変数値の再カテゴリ化)について-その1  青木繁伸  2002/10/20 (日) 16:30
> 次に,重回帰分析について質問があるのですが,Y「主観的幸福感」(5段階評価)を従属変数とし,

従属変数が5段階の順序尺度変数というのは,妥当でしょうか?

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 021 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る