立地選び
データ分析方法2
データ分析の注意点
現地調査データを収集した後は、データを得点化し、その合計で立地を評価します。
ただし、データを単純に合計する事はできません。
ここで、データ数を少なくした簡単な例で考えてみる事にします。
A物件・・・・商圏世帯数1000、通行量300人
B物件・・・・商圏世帯数2000、通行量100人
この2物件の内どちらが良いかという事を考えます。
単純に数値を合計して、
A物件・・・・1000+300=1300?
B物件・・・・2000+100=2100?
としてしまうと、何かおかしい感じがします。
世帯数の単位は「世帯」であり、通行量の単位は「人」ですので、値を合計するのは誤りです。
データ分析事例
このように、単位が異なるデータを扱うときは、前回紹介した「データの標準化」という考え方を用います。(他にも手法はありますが、割愛させて頂きます)
データを標準化するために、それぞれの平均値と標準偏差を求めると、
世帯数の平均値1244世帯、標準偏差753
通行量の平均値215人、標準偏差142
であったとします。
(A、Bの2物件以外にもいくつかの調査データから求めたと仮定した値です)
平均値と標準偏差からデータを標準化すると、
A物件・・・・世帯数-0.32、通行量0.60
B物件・・・・世帯数1.00、通行量-0.81
となります。
標準化されたデータは平均が0、分散が1になるという性質があり、単位が無次元の値になるため、
ここで初めて単位が異なるデータ間の合計が可能になります。
つまり、
A物件の得点-0.32+0.60=0.28
B物件の得点 1.00-0.81=0.19
となります。
これで単位が異なるデータを合計するという問題はクリアできましたが、もう一つ問題があります。
それは、立地を構成する要素(この例では世帯数と通行量)の影響度は同じか?という問題です。
次回はこの解決方法を含めた簡易的な売上予測の考え方について説明させて頂きます。