目次
1. 概要
データ分析をスムーズに行う上で重要なことは色々ありますが、特に初学者にとって重要なのがデータの入力の仕方です。これ次第で、その後の分析作業の効率がExcelと同程度になるか、統計ソフトらしい効率的な操作を実現できるかが決まります。
ここでは、データ分析をスムーズにするためのデータ入力のコツをご説明します。
2. このExcelデータ、皆さんならどうコピーしますか?
以下のデータは、2011年と2012年の7〜9月期の2製品の不良数をまとめたものです。
このデータの配列はExcelならよく見かける形式です。ほとんどのPCのディスプレイは横長に設計されていますので、誰もが自然と横長な(データの視認性の高い)表を作ります。
さて、MinitabはExcelからコピー&ペーストでデータを移せますが、皆さんならこのデータをどんな風にMinitabのワークシートにコピーするでしょうか?
多くの方は、ほぼExcelの表のまま上図のようにコピーすると思います。(Minitabは1行目のグレーのセルにデータのタイトルを付けなければならないので、2行でセル結合されている箇所は1行にまとめます。)
3. 横長のデータ配列の欠点
ここで上司から「不良数の平均やばらつきに年ごとの違いはあるの?」と聞かれました。Minitabを使ってその分析要求に答えようとした時、どのような手順が発生するか見てみましょう。
1. データの並び替え:年ごとに不良数が1列に並ぶようにデータを積み重ねます。
2. メニューの選択:Minitabメニューから、グラフ > 個別値プロット > 複数のY - 単純 を選択。
3. データの選択:以下のように '2011' と '2012' の列を選択し、【OK】をクリック。
4. 結果の出力:2011年と2012年の不良率をプロットしたグラフの完成。
これだけ見ると特に問題があるようには見えませんが、この後さらに上司から、「じゃあ、製品ごとの違いは?」と追い討ちがかかったとします。そうすると、また改めて 1. データの並べ替え から行わなければなりません。
1. データの並べ替え:製品ごとに不良数が1列に並ぶようにデータを積み重ねます。
2. メニューの選択... (以下略)
つまり何が言いたいかというと、横長のデータ配列のままMinitabに移してしまうと、分析の切り口に応じてデータを並び替えなければならなくなります。これではExcelでの分析とやっていることは変わりません。(Excelも作りたいグラフに応じてデータを並び替えたり、加工したり、範囲選択を変えなければなりません。)それどころか、私たちはみんなExcelに慣れ親しんでいるため、Minitabのような統計ソフトの使い方をわざわざ新たに覚えて使うほどのメリットはありません。
これはMinitabの誤った使い方といってもいいかもしれません。
4. おすすめの入力方法
ここからが本題です。Minitabにデータをコピーする前に、Excel上で以下のように並び替えてみてください。
表としては見辛いでしょうが、縦長のデータにします。これがデータ分析をスムーズにする秘訣です。最初は表を紐解くこと自体が大変かもしれませんが、こうしておくことで分析にかかる作業負荷を大幅に軽減します。
表を紐解くコツは、表に含まれる要素をMinitabの列名としてそのまま書き出すことです。例として、左表に含まれる要素と列名の対応を色分けして表現しています。参考にしてみてください。
では、このデータを使って先ほどの上司の方の分析要求に応えていきます。
1. グラフ > 個別値プロット > 1つのY - グループ を選択。
2. 以下のように '不良数' をグラフ変数に、比較の切り口とする '年' をグループ変数に選択し、【OK】をクリック。
3. 結果の出力。
このように、縦長のデータ配列であれば、Minitabは分析の切り口に応じたデータの並べ替えを必要としません。つまり、手順を1つ少なくすることができます。
「データを並べ替える手間」が無くなることは、皆さんの想像する以上に分析作業を効率的にします。次々に別の比較の切り口を求められても、以下のように比較の切り口を直感的に選択でき、分析をドンドン先に進めることができます。
1. キーボードの Ctrl + E をクリックし、直前のダイアログボックスを起動。
2. グループ変数欄の比較の切り口を '製品' に変更し、【OK】をクリック。
3. 製品別の結果を出力
4. キーボードの Ctrl + E を再度クリックし、グループ変数欄の比較の切り口を '月' に変更し、【OK】をクリック。
5. 月別の結果を出力。
5. さらにこんなこともできる
Minitabを使えば、さらに以下のような多層の比較もできます。
1. キーボードの Ctrl + E をクリックし、グループ変数欄の比較の切り口を '年' と '製品' を選択し、【OK】をクリック。
2. 年別の製品ごとの結果を出力。
6. まとめ
- 横長のデータ配列のままMinitabにデータをコピーしてしまうと、その後、分析・比較の切り口に応じてデータを並び替えなければならなくなる。これではExcelでの分析と比べ、作業時間・負荷に大差がない。(むしろ慣れている分だけExcelの方が楽)
- データ分析をスムーズにするコツは、先にデータを縦長に配列させておくこと。縦長のデータであれば、分析・比較の切り口に応じてデータを並べ替える必要がなくなる。
- さらに、分析・比較の切り口を直感的に選択できるようになり、分析作業時間を大幅に短縮できる。(なにより気持ち良く分析できる!)
コメント
0件のコメント
サインインしてコメントを残してください。