分析フレームワーク(3-1) データを集めるとは?

ilm2009_01_010-s

あなたは子供のころからデータを集めまくっています

  • 授業中にとるノートはデータです
  • 夏休みの宿題の絵日記もデータです
  • 作文もデータです
  • 写真もデータ
  • プリクラもデータ
  • ブログもデータ
  • ツイッターもデータ
  • 携帯のメールもデータです
  • ファイスブックもデータ
  • 成績表もデータです
  • 報告書もデータです
  • 思い出のアルバムもデータです

データとは記録されたもの全てです

デジタルだろうがアナログだろうが記録されたもの全てがデータです

データと言っても色々なデータがあります

diagram3101

データ分析と聞くと売上などの数値データだけを思い浮かべる人も多いでしょう

実際は、新聞などのテキストデータも分析します

記録されたものを分析するのがデータ分析です

データには定量データと定性データがあります

ざっくり言うと、数量で表されているのが定量データ

テキストなど数量で表されていないのが定性データです

diagram3102

多くの人がイメージするのは定量データです

一方、世の中に多いのは定性データです

分析しやすいのは定量データです

一方、分析に一工夫必要なのは定性データです

注意点があります

数字を記号として用いているデータは定性データです

例えば、アンケートなどで

  • 「1を男性」
  • 「2を女性」

と表現する場合などです

数字ですが数量でありません

ilm01_ad05044-s

なぜなら、この場合の1と2には量としての意味はない

  • 「1を女性」
  • 「2を男性」

としても問題ない

つまり、この場合の1と2はただの記号にすぎません

集めるデータには色々あります

数量以外のデータも集めます

定量だろうが定性だろうが必要であれば集めます

どうせ集めるなら活用しやすい集め方、分析しやすい集め方が理想です

ilm20_ab06013-s

上手くデータを集めたい

例えば、上手いデータの集め方は子供時代の上手いノートの取り方と似ています

  • 復習の時に見やすいノート
  • テストで出そうなところが一発で分かるノート

つまり、ある目的に活かしやすいノートです

diagram3103

メッセージボードと系統図(ツリー)

メッセージボード系統図(ツリー)がしっかりしている

上手いデータ集めの最低条件です

さらに、次の3つを意識すると良いでしょう

  • セカンダリーデータから集める
  • 集めたデータの前提を明確にする
  • データは対を意識して集める

プライマリーデータとセカンダリーデータ

データには、誰が集めたデータかでプライマリーデータセカンダリーデータがあります

  • プライマリーデータ:自ら企画して集めたデータ
  • セカンダリーデータ:既にある他人が集めたデータ

プライマリーデータ

プライマリーデータは、自ら企画して集めたアンケートやヒアリング、自社の売上、POSデータなどです

自ら企画するので欲しいデータが手に入り易いです

しかし、一から企画するので時間がかかるのが難点です

セカンダリーデータ

一方、セカンダリーデータは、公的な統計データや白書、新聞記事などです

すでに世の中に存在しています。すぐに手に入ります

しかし、本当に欲しいデータは集まりません

ずれています

一長一短

プライマリーデータとセカンダリーデータには一長一短があります

diagram3104

どちらのデータを集めるのか?

データに求める精度納期とのバランスで決まります

集めたデータの前提

そして、集めたデータには必ず前提があります

データの前提とはデータの素性です。7何(6W1H)で表現されます

  • 誰が?:データを企画し集めた人・組織
  • 誰に対し:データ収集対象者
  • なぜ?:集めた目的
  • いつ?:集めた時期
  • どこで?:集めた場所(対象者のエリアなど)
  • 何を?:集めたデータの内容
  • どのように?:データの集め方

diagram3105

例えば、米国の売上データを分析しても日本の売上データを分析したことにはなりません

集めた場所が異なります

10年前のデータを分析して今を語ることはできません

集めた時期が異なります

データの前提は分析結果の読み方に大きく影響を及ぼします

データは対を意識して集める

データの前提と同じぐらい非常に重要なことがあります

データはを意識して集めなければならない

なぜならデータ分析の基本は「比較」だからです

例えば、「今日の気温は25度です」と言っても、気温が高いのか低いのか分かりません

何かと比較して初めて高い低いが言えます

fur014-s

比較対象が無ければ何も言えない

ただそこにデータがあるだけ

何が起こっているのか分からない

何が起ころうとしているのか分からない

それではアクションには繋がらない

データを集めるとき「対になるデータ」も集められているか確認しましょう

サブコンテンツ

このページの先頭へ