★ データの分布について(まとめ) ★

8796. データの分布について(まとめ) 青木繁伸 2005/12/20 (火) 18:19
└8797. Re: データの分布について(まとめ) 青木繁伸 2005/12/20 (火) 18:19
 └8798. Re^2: データの分布について(まとめ) 青木繁伸 2005/12/20 (火) 18:19
  └8800. Re^3: データの分布について(まとめ) 青木繁伸 2005/12/20 (火) 18:20
   └8801. Re^4: データの分布について(まとめ) 青木繁伸 2005/12/20 (火) 18:20


8796. データの分布について(まとめ) 青木繁伸  2005/12/20 (火) 18:19
8760. データの分布について さく 2005/12/19 (月) 15:45

突然の質問で失礼します。
私は統計に関して非常に初心者なもので,現在は調査のデータを分析していて,行き詰まってしまいました。先生のホームページを含めて,インターネットで統計に関していろいろ検索してみましたが,よく分かりませんでした。現状は以下に記します。

概要:
- 気分に関する調査(自由回答)の回答を対象に,なるべく多くの人が思い出せるような回答を判別して使用したいと考えています。(回答が多くて,減らす理由もあります)
- 自由回答の質問例:
あなたが不安な時に感じる感覚をできるだけ多くあげて下さい。(例:くよくよする,はらはらする等)
- 回答は同じ内容を持つ回答をまとめて,その数回答数として表します。
No. 回答数
1 139
2 54
3 54
4 51
5 27
6 23
7 20
8 9
9 8
10 7
・・・
249 1
そこで,横軸は回答,縦軸は回答数として,まずデータ分布を調べました。
散布図上で,近似曲線を追加して式とR2を見てみまして,他の近似曲線はR2が小さく,累乗近似曲線は適していると考えています「y = 113.77x^(-1.0302),R2 = 0.9394」。
また,勝手ながら,データの分布は視覚的に指数分布に似ていると考えられます。しかしながら,指数分布では,y = 22.087e^(-0.0569x),R2 = 0.6626,そもそもいくつかの指数分布のデータが混合しているのではないかと思っています。

近似曲線やデータの分布についていろいろ検索してみましたが,これからどのように観察すればよいのか分からなく,勝手に質問をさせて頂いている次第です。
このようなデータは混合した指数分布のデータと判断してよいかどうか?
回答を減らすにはどのような視点・方法を持って分析すればよいのでしょうか?どの程度まで減らしてよいのか?
ご教示を頂ければ幸いです。

まだまだ勉強不足で,至らない点が多々ありお恥ずかしい限りです。どうぞ宜しくお願い致します。

     [このページのトップへ]


8797. Re: データの分布について(まとめ) 青木繁伸  2005/12/20 (火) 18:19
8761. Re: データの分布について 青木繁伸 2005/12/19 (月) 16:03

回答する人の多い質問項目を選ぶということが目的でしたら,「上位何項目まで」という決め方で良いのではないでしょうか。

しかし,問題は,本当にそのようにして選ばれた項目が調査目的に合うかということではないでしょうか。
個人ごとの回答状況をデータとして,因子分析などによって項目を選ぶ方が,後々の利用を考えるとよろしいのかも。
http://aoki2.si.gunma-u.ac.jp/lecture/PFA/pfa8.html
にあるような例が参考になるかもしれませんね。

     [このページのトップへ]


8798. Re^2: データの分布について(まとめ) 青木繁伸  2005/12/20 (火) 18:19
8763. Re^2: データの分布について さく 2005/12/19 (月) 17:11

ご返事を頂きまして誠に有難うございます。
先生がおっしゃった通りです,質問が不明瞭で大変失礼致しました。
> しかし,問題は,本当にそのようにして選ばれた項目が調査目的に合うかということではないでしょうか。

調査は自由回答で,回答者になるべく多く挙げてもらうように指示しましたので,数値化できるのは似た回答の数だと思いつきました。
因子分析なら,いくつかの選択肢を点数に基づくものだと認識していますが,自由回答のデータの場合,選ばれた回答の数でどのように因子分析ができるのでしょうか?また,個人ごとの回答状況は何を指しますのでしょうか?
因子分析に関しても勉強不足で,至らない点が多々あり大変恐縮ですが,ご教示を頂ければ幸いです。

     [このページのトップへ]


8800. Re^3: データの分布について(まとめ) 青木繁伸  2005/12/20 (火) 18:20
8766. Re^3: データの分布について 青木繁伸 2005/12/19 (月) 18:21

まあ,面倒くさくてたくさん回答しなかった人というのもいるので困るでしょうが。

質問紙を作る第一段階は自由記述で調査して,回答の多かった項目で調査票を作って予備調査,そのデータを使って因子分析して調査票を確定。それを使って本調査という手順。

予備調査を行えないとすれば,自由記述のデータをデータ行列に起こしてそれを分析する。
一人あたりどれくらいの項目が記述されていたかにもよるけど。
取り上げる項目は多い方から数えて適当な数(下では k 個)

    項目1 項目2 … 項目k
Aさん 0 1 1
Bさん 1 0 0

Zさん 0 1 0

のようなデータ行列ができるかな。
やはりこれは便宜的なやり方なので,ちゃんと予備調査を行った方がよいとは思います。

     [このページのトップへ]


8801. Re^4: データの分布について(まとめ) 青木繁伸  2005/12/20 (火) 18:20
8767. Re^4: データの分布について さく 2005/12/19 (月) 19:27

早速のご返事を頂いて誠に有難うございました。
丁寧なご教示を頂いたことを重ねてお礼を申し上げます。

個人ごとのデータを並べ替えて推定してみます。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 036 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る