分析フレームワーク(3-1) データを集めるとは?
あなたは子供のころからデータを集めまくっています
- 授業中にとるノートはデータです
- 夏休みの宿題の絵日記もデータです
- 作文もデータです
- 写真もデータ
- プリクラもデータ
- ブログもデータ
- ツイッターもデータ
- 携帯のメールもデータです
- ファイスブックもデータ
- 成績表もデータです
- 報告書もデータです
- 思い出のアルバムもデータです
データとは記録されたもの全てです
デジタルだろうがアナログだろうが記録されたもの全てがデータです
データと言っても色々なデータがあります
データ分析と聞くと売上などの数値データだけを思い浮かべる人も多いでしょう
実際は、新聞などのテキストデータも分析します
記録されたものを分析するのがデータ分析です
データには定量データと定性データがあります
ざっくり言うと、数量で表されているのが定量データ
テキストなど数量で表されていないのが定性データです
多くの人がイメージするのは定量データです
一方、世の中に多いのは定性データです
分析しやすいのは定量データです
一方、分析に一工夫必要なのは定性データです
注意点があります
数字を記号として用いているデータは定性データです
例えば、アンケートなどで
- 「1を男性」
- 「2を女性」
と表現する場合などです
数字ですが数量でありません
なぜなら、この場合の1と2には量としての意味はない
- 「1を女性」
- 「2を男性」
としても問題ない
つまり、この場合の1と2はただの記号にすぎません
集めるデータには色々あります
数量以外のデータも集めます
定量だろうが定性だろうが必要であれば集めます
どうせ集めるなら活用しやすい集め方、分析しやすい集め方が理想です
上手くデータを集めたい
例えば、上手いデータの集め方は子供時代の上手いノートの取り方と似ています
- 復習の時に見やすいノート
- テストで出そうなところが一発で分かるノート
つまり、ある目的に活かしやすいノートです
メッセージボードと系統図(ツリー)
メッセージボードと系統図(ツリー)がしっかりしている
上手いデータ集めの最低条件です
さらに、次の3つを意識すると良いでしょう
- セカンダリーデータから集める
- 集めたデータの前提を明確にする
- データは対を意識して集める
プライマリーデータとセカンダリーデータ
データには、誰が集めたデータかでプライマリーデータとセカンダリーデータがあります
- プライマリーデータ:自ら企画して集めたデータ
- セカンダリーデータ:既にある他人が集めたデータ
プライマリーデータ
プライマリーデータは、自ら企画して集めたアンケートやヒアリング、自社の売上、POSデータなどです
自ら企画するので欲しいデータが手に入り易いです
しかし、一から企画するので時間がかかるのが難点です
セカンダリーデータ
一方、セカンダリーデータは、公的な統計データや白書、新聞記事などです
すでに世の中に存在しています。すぐに手に入ります
しかし、本当に欲しいデータは集まりません
ずれています
一長一短
プライマリーデータとセカンダリーデータには一長一短があります
どちらのデータを集めるのか?
データに求める精度と納期とのバランスで決まります
集めたデータの前提
そして、集めたデータには必ず前提があります
データの前提とはデータの素性です。7何(6W1H)で表現されます
- 誰が?:データを企画し集めた人・組織
- 誰に対し:データ収集対象者
- なぜ?:集めた目的
- いつ?:集めた時期
- どこで?:集めた場所(対象者のエリアなど)
- 何を?:集めたデータの内容
- どのように?:データの集め方
例えば、米国の売上データを分析しても日本の売上データを分析したことにはなりません
集めた場所が異なります
10年前のデータを分析して今を語ることはできません
集めた時期が異なります
データの前提は分析結果の読み方に大きく影響を及ぼします
データは対を意識して集める
データの前提と同じぐらい非常に重要なことがあります
データは対を意識して集めなければならない
なぜならデータ分析の基本は「比較」だからです
例えば、「今日の気温は25度です」と言っても、気温が高いのか低いのか分かりません
何かと比較して初めて高い低いが言えます
比較対象が無ければ何も言えない
ただそこにデータがあるだけ
何が起こっているのか分からない
何が起ころうとしているのか分からない
それではアクションには繋がらない
データを集めるとき「対になるデータ」も集められているか確認しましょう
タグ:データ分析, データ分析フレームワーク, 分析フレームワーク