統計初学者に向けた回帰分析における従属変数、独立変数、回帰係数の説明

回帰分析は統計学の手法の一つであり、変数間の関係性を調べるために用いられます。この分析に利用される変数を従属変数と独立変数と言い、この関係性を把握するのが回帰分析です。言い換えると、ある変数(従属変数と呼ばれる)が他の変数(独立変数と呼ばれる)にどのように影響されるかを調べるために使われます。また、変数間の関係性の強さを回帰係数と言います。以下に、これらの用語を具体例を含めながら説明します。

従属変数(Dependent Variable)とは

従属変数は、他の変数(独立変数)に影響を受ける変数のことを指します。従属変数は、分析の対象、つまり分析の目的となる対象を指します。そのため、一般的に従属変数は目的変数とも呼ばれます。例えば、商品の売上高の分析を考えます。この場合、分析の対象はもちろん売上高ですので、売上高が従属変数です。この分析に用いる、購入者の属性や購入日の気温など売上に関係するそのほかの要素をこの後説明する独立変数と言います。

独立変数(Independent Variable)とは

独立変数は、先ほど説明した従属変数に影響を与える変数のことを指します。独立変数は、従属変数の変動や振る舞いを説明するために用いられます。先ほどの従属変数の売上高の変化や振る舞い(上がった、下がった、急に上がったなど)に対して、商品の価格や広告費、購入者の属性、購入日の気温など様々なものが独立変数として考えられます。

回帰係数(Regression Coefficient)とは

回帰係数は独立変数が従属変数にどの程度影響を与えるかを示す数値です。回帰係数は独立変数の変化が従属変数の変化にどの程度関連しているかを示します。例えば、広告費(独立変数)が売上高(従属変数)に与える影響の大きさを示す回帰係数が正であれば、広告費が増加すれば売り上げも増加すると解釈されます。

この独立変数と独立変数の関係性を一般化し、数式として表したものを回帰モデルと言います。回帰分析の目的は、実際のデータと回帰モデルとの間の誤差を最小化するように、回帰係数を推定することと言えます。