立地選び
データ分析方法1
データ分析の目的
現地調査データを収集した後は、データを分析し、立地を評価します。
立地のデータを得点化し、総合評価を算出するのですが、データを単純に合計するだけでは不十分です。(不十分である理由は次回説明します)
様々なデータから何らかの結論を出す場合にはデータを扱うための基礎的な知識が必要になります。
データ分析で用いる用語
データ分析には様々な指標が用いられますが、ここでは代表的なものを紹介します。
?平均
?分散
?標準偏差
?標準化されたデータ
?相関係数
平均とはデータの合計をデータ数で割ったものです。
あるデータを平均と比較する事で全体の中での位置が把握できます。
分散とは各データと平均との差の二乗和(偏差平方和)をデータ数(またはデータ数-1)で割ったものです。
分散を用いるとデータの散らばり具合(データの持つ情報量)がわかります。
標準偏差は分散の平方根です。データの単位に左右されるという分散の欠点を補うもので、イメージ的にはデータの散らばり具合の平均を表す指標になります。
標準化されたデータとは、あるデータと平均との差を標準偏差で割ったものです。
標準化する事により、異なる単位を持つデータ間の比較が可能になります。
相関係数とは2つのデータの共分散をそれぞれのデータの標準偏差の積で割ったものです。
相関係数は2つのデータ間の関係の強弱を表します。
次回はこれらの指標を用いたデータの分析方法について説明させて頂きます。