分析フレームワーク(3-3) より正確にはプライマリーデータ
セカンダリーデータはすでにあるデータです
すぐに分析に使えます
しかし、本当に欲しいデータとずれています
本当に欲しいデータはプライマリーでーとして集める
一方、プライマリーデータは自ら企画して集めたデータです
例えば、
- アンケートであればアンケート票の設計や実施
- 購買履歴データなどのシステムが絡んでいれば希望するデータが取得できるような設計や改修
- アクセス解析であればタグの設計や改修
自ら企画し欲しいデータを集めます
注意点があります
プライマリーデータは必ず欲しいデータが必ず取得できるわけではない
データを集めるための企画がしっかりしている必要があります
企画が悪いと欲しいデータが手に入りません
欲しいデータを明確にする
そのために欲しいデータを明確にする必要があります
欲しいデータが明確でないと欲しいデータは手に入りません
あやふやな状態でデータを集めると、後で後悔します
欲しいデータを明確にするには次の3つが必要です
- セカンダリーデータ
- メッセージボード
- データの系統図(ツリー)
主役はメッセージボードとデータの系統図(ツリー)です
セカンダリーデータはあくまでも参考です
プライマリーデータを集めでもセカンダリーデータは重要
とは言っても、セカンダリーデータは呼び水になります
具体的なデータのイメージが湧きます
どのようなデータが集められるか分かります
どのようなデータが欲しいのか明確になります
例えば、
- セカンダリーデータが2年前のデータであれば今年のデータが欲しい
- セカンダリーデータが性別に分かれていなければ性別のデータが欲しい
- 時間帯別のデータが欲しい
- 他のエリアのデータが欲しい
- もっと詳細な売上データが欲しい
- 同時に購入されている商品のデータが欲しい
などなどです
プライマリーデータを集める企画
メッセージボードを眺めます
データの系統図(ツリー)を眺めます
集めたセカンダリーデータを眺めます
「もっとこういうデータが欲しい」という感じになります
そして、現実的に取得可能なデータを考えてプライマリーデータを集める企画を考えます
プライマリーデータは集めて終了ではありません
セカンダリーデータ以上に手間暇がかかります
集めた後に非常に手間暇がかかります
集めたデータはそのままでは分析できません
分析しやすいデータ形式に加工します
どのような分析をするのかでデータの形式は変わります
データ加工の時間はキケンです
下手をすると膨大になります
データ分析の中で一番長くなります
地味ですがミスをすると大変です
その後の分析に悪影響を及ぼします
集め分ける
プライマリーデータは自ら企画してデータを集めます
時間とお金のコストがかかります
欲しいデータが手に入ります
より正確なデータ分析をするならプライマリーデータ
スピードを求めるならセカンダリーデータを集めましょう
タグ:データ分析, データ分析フレームワーク, 分析フレームワーク