分析フレームワーク(3-3) より正確にはプライマリーデータ

gum11_ph08003-s

セカンダリーデータはすでにあるデータです

すぐに分析に使えます

しかし、本当に欲しいデータとずれています

本当に欲しいデータはプライマリーでーとして集める

一方、プライマリーデータは自ら企画して集めたデータです

例えば、

  • アンケートであればアンケート票の設計や実施
  • 購買履歴データなどのシステムが絡んでいれば希望するデータが取得できるような設計や改修
  • アクセス解析であればタグの設計や改修

自ら企画し欲しいデータを集めます

 

diagram3301

 

注意点があります

プライマリーデータは必ず欲しいデータが必ず取得できるわけではない

データを集めるための企画がしっかりしている必要があります

企画が悪いと欲しいデータが手に入りません

 

diagram3302

 

欲しいデータを明確にする

そのために欲しいデータを明確にする必要があります

欲しいデータが明確でないと欲しいデータは手に入りません

あやふやな状態でデータを集めると、後で後悔します

欲しいデータを明確にするには次の3つが必要です

  • セカンダリーデータ
  • メッセージボード
  • データの系統図(ツリー)

主役はメッセージボードとデータの系統図(ツリー)です

 

diagram3303

 

セカンダリーデータはあくまでも参考です

プライマリーデータを集めでもセカンダリーデータは重要

とは言っても、セカンダリーデータは呼び水になります

具体的なデータのイメージが湧きます

どのようなデータが集められるか分かります

どのようなデータが欲しいのか明確になります

例えば、

  • セカンダリーデータが2年前のデータであれば今年のデータが欲しい
  • セカンダリーデータが性別に分かれていなければ性別のデータが欲しい
  • 時間帯別のデータが欲しい
  • 他のエリアのデータが欲しい
  • もっと詳細な売上データが欲しい
  • 同時に購入されている商品のデータが欲しい

などなどです

プライマリーデータを集める企画

メッセージボードを眺めます

データの系統図(ツリー)を眺めます

集めたセカンダリーデータを眺めます

もっとこういうデータが欲しい」という感じになります

そして、現実的に取得可能なデータを考えてプライマリーデータを集める企画を考えます

プライマリーデータは集めて終了ではありません

セカンダリーデータ以上に手間暇がかかります

集めた後に非常に手間暇がかかります

集めたデータはそのままでは分析できません

 

diagram3304

 

分析しやすいデータ形式に加工します

どのような分析をするのかでデータの形式は変わります

データ加工の時間はキケンです

下手をすると膨大になります

データ分析の中で一番長くなります

地味ですがミスをすると大変です

その後の分析に悪影響を及ぼします

集め分ける

プライマリーデータは自ら企画してデータを集めます

時間とお金のコストがかかります

欲しいデータが手に入ります

より正確なデータ分析をするならプライマリーデータ

スピードを求めるならセカンダリーデータを集めましょう

サブコンテンツ

このページの先頭へ