標準化 (Standardization)
標準化(Standardization)とは、機械学習で回帰モデルを構築する際に一般的に用いられる手法で、データのスケール(範囲)を一定の基準に揃える前処理のことを指します。
具体的には、データの平均を0、分散を1の正規分布に変換する操作です。これにより、異なるスケールを持つ特徴量を同一のスケールにさせることができ、モデルの学習効率が向上します。
似たようなスケールの調整方法に、正規化があります。最大値および最小値が決まっていない場合や、外れ値が存在する場合は、標準化を使用することが望ましいです。
標準化の計算式は以下の通りです。(x’:標準化された値、x:標準化される前の値、μ:平均、σ:標準偏差)

