標準化係数
統計では、 標準化係数 ( ベータ係数またはベータ重みとも呼ばれます )は、従属変数と独立変数の分散が1になるように標準化された回帰分析の結果の推定値です。したがって、標準化係数は、変数は、予測変数の標準偏差の増加ごとに変化します。直交予測子を使用した単純な線形回帰の場合、標準化された回帰係数は、独立変数と従属変数の間の相関に等しくなります。
使用法
係数の標準化は、通常、変数が異なる測定単位で測定される場合(たとえば、ドルで測定される収入と個人の数で測定される家族のサイズ)。
元の(標準化されていない)変数に対して実行された回帰により、標準化されていない係数が生成されます。標準化された変数で実行される回帰により、標準化された係数が生成されます。標準化された係数と標準化されていない係数の値は、いずれかのタイプの分析の後に導出することもできます。
実装
重回帰問題を解く前に、すべての変数(独立および従属)を標準化できます。各変数は、その値のそれぞれからその平均値を減算し、変数の標準偏差でこれらの新しい値を除算することにより標準化できます。重回帰のすべての変数を標準化すると、標準偏差で測定された従属変数の変化を示す標準化された回帰係数が得られます。
PSPP、SPSS、SYSTATなどの一部の統計ソフトウェアパッケージでは、標準化された回帰係数に「ベータ」とラベル付けされ、標準化されていない係数には「B」とラベル付けされます。 DAP / SASのような他のものは、それらに「標準化係数」というラベルを付けます。標準化されていない変数にも「b」というラベルが付けられている場合があります。
長所と短所
標準係数の支持者は、係数が独立変数の単位のスケールを無視することに注意しているため、比較が容易になります。
批評家は、そのような標準化は誤解を招く恐れがあると懸念しています。変数を標準化すると、その値から測定単位が削除されるため、特定の関係の標準化係数は、分布の変動に対する強度のみを表します。これは、小さなサンプルに基づいて平均と標準偏差を使用して変数を標準化するときに、サンプリングエラーによるバイアスを招きます。さらに、1つの変数の1つの標準偏差の変化は、2つの変数の分布の形状が互いに類似している限り、別の予測変数の1つの標準偏差の変化と同等です。標準偏差の意味は、非正規分布間で著しく異なる場合があります(たとえば、歪んだ場合や非対称の場合)。これは、パラメトリック統計における正規性の仮定の重要性を強調しており、標準化された係数推定値を解釈するときに、非正規分布を扱う場合はノンパラメトリック回帰でも解決しない追加の問題を提起します。