No.14178 Re: テストデータ(2値データ)の分析について:因子分析のかわりに分散分析はどうか? 【青木繁伸】 2011/01/20(Thu) 23:10
> 各タイプごとに合計点の平均値を求め,それらを被験者内の分散分析にかけました。結果は以下の通りで,すべての各タイプ間で1%水準で有意差が確認されました。
まあ,大ざっぱに考えても,でたらめな分類をしてもそれぞれの群間に差があるような分類はあり得るでしょう。また,差があるような分類を探索的に探すことはできるでしょう。しかし,そのような場合であっても,そのような分類をした理論的根拠を示すことはできないでしょう。
> このように2値データのテストデータを用いた因子分析を行っている例がなく,不安ですので,ひとまず手を出さないことにし
こ の掲示版でも何度となく提示(質問)されていることですが,0/1 データというの名義尺度という一番低水準なデータであると同時に間隔尺度(比尺度)という最高級のデータでもあるのです。2つの名義尺度間の属性相関係数 であるφ係数はそれぞれの変数の取る2つの値を例えば 0/1 のようにおいて計算したピアソンの積率相関係数と同じになります。そして,因子分析等に使われるのはピアソンの積率相関係数ですよね。つまり,名義尺度の 取る二値を 0/1 などにおいて他の間隔尺度・比尺度変数と一緒にして相関係数を求め更に因子分析をしても,何の支障もないのです(0/1データを用いる重回帰分析や判別分 析と同じ位置づけです)。まあ,物事を厳密に考えて,そのような場合にはポリコリック相関係数とか何とかを求めて因子分析をするというようなやり方もある ようではあります。
No.14180 Re: テストデータ(2値データ)の分析について:因子分析のかわりに分散分析はどうか? 【学校教員】 2011/01/21(Fri) 12:08
青木先生
お忙しいところ,ご回答いただきありがとうございました。
確かに,2値 データを間隔尺度としてみなすことができることは存じ上げておりましたが,どうも自分の思い描いていた分類と異なる結果が得られそうな気がしており(例え ば,各文法知識タイプ(これは私が勝手に分類しているものですが)内において正答率が高い項目同士で因子をなし,「初歩的文法知識」のような因子が得られ そうだと直感的に感じております。),因子分析を意図的に避けていたようです。ですが,それは統計を用いた分類法を行うという立場からは,不当な回避に違 いありませんので,再度考えてみたいと思います。クラスター分析を使っても,結局分類の根本的な理論的根拠が示せないことも理解いたしました。分散分析も そうですが,あくまで探索的なグルーピングの一証拠として用いたいと思います。
先生からご指摘いただいたことをふまえ,例えば言語学的に静的に分類することと,統計的に分類すること(私の問題では,実際に文法知識が個々の生徒の中でどのような能力として体現されているか)はやはり異なるのだなぁと実感しております。
もっともっと勉強をしていきたいと思います。
ありがとうございました。
学校教員
● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る