データ解析の手順     Last modified: May 05, 2004

 データ解析の手順は,大きく分けて以下のようになる。

 以下に順序に従って,大まかに解説する。
  1. データファイルの作成

     分析すべきデータは,どのような形でユーザの手元にあるのであろうか。
     データが調査票やカルテの形でしか用意されていない場合には,まずデータファイルを作らなけれならない。この場合,自分が使用する分析プログラム(プログラムパッケージ)が要求している形式に合せなければならない。各分析プログラムパッケージにはデータ入力用のプログラムも含まれているので,それを利用するのがよい。
     プログラムパッケージが要求するデータファイルの形式によっては,汎用のエディタでデータファイルを作成することもできる。また,データファイルの維持・管理上からは, データベースソフトウェア,ワークシートソフトウェアの利用も考えられる(次節を参照)。

  2. データファイルの形式変換

     すでに何等かの手段でデータファイルとして用意されているならば,すぐにも分析を始めたいところであろう。しかし,ユーザが使用しようとしている分析プログラム(プログラムパッケージ)が処理できるデータファイルの形式と一致しているかどうかをまず確かめておかなければならない。
     多くのプログラムパッケージは,数値データをカンマで区切った CSVファイルを使用できる。しかし,プログラムパッケージによっては,特殊な形式のデータファイルを使用するものもある。このような場合には,まず最初にデータファイルの変換を行わなければならない。多くの場合,各プログラムパッケージにはデータ変換のためのプログラムが用意されている。
     統計プログラムパッケージによっては,数値データしか利用できないものもあるので,文字変数を使用している場合にはまえもって変換しておく必要がある。例えば,性別を M,F で表わしているような場合に,それぞれを 1,2 のように変換する(注3)。

  3. データファイルのチェック

     データファイルが作成されたならば,次にデータファイルが正しく作られたかどうかチェックする必要がある。
     入力ミスがないか,抜け落ちた部分がないか,重複はないかなど,データファイルの元になった調査票やチェックリストとの比較が必要である。また,場合によっては,元になったデータ自体に矛盾や誤りを含む場合もあるので,調査票やチェックリストと全く同じであってもすぐに分析を開始するのは危険である(次節参照)。

  4. 基礎的な集計

     データファイルが用意できれば,データ解析が開始される。データ解析は,予備的な解析から目的を絞った高度な解析へと,段階を追って行わなければならない。中には,いきなり多変量解析へと進みたい人もいるだろうが,基本的な分析結果を踏まえていなければ分析結果を正しく解釈できないであろう。また,基礎的な集計を行っている段階で,後の分析に対する多くの知見が得られる。その中には,後の分析手法の適用の可否に関する知見も出てくる。

  5. 研究目的に見合った本格的な解析

     研究目的によって,採用されるべき解析手法は自ずと定まる。ただし,各解析手法はそれぞれ解析されるデータにさまざまな条件を要求する場合がある。採用しようとする分析手法が必要とする情報と条件をまえもって確認しておかなければならない。


・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI