5分でわかる!「回帰係数」の求め方(回帰直線の傾き)

データ分析
データ分析
スポンサーリンク

統計学の回帰分析を使うと、身長と体重のような2つのデータから、回帰直線「体重 = 身長 × 回帰係数 + 切片」(上のグラフの赤線のことです)を求め、身長から体重を予測することができます。例えば、気温からビールの売れ行きを予測したり、天気から来客数を予測したりと、仕事にも活用できそうですね。そこで今回は、回帰分析の一番のキモ「回帰係数」(「回帰直線の傾き」ともいいます)の求め方をわかりやすくまとめてみました。

例題

下の表は、あるメーカーの、商品A と 商品B の販売個数です。商品Aの販売個数によって、商品Bの売れ行きを予測したいと思います。予測のための回帰係数を求めてみましょう。

◎ 商品Aと商品Bの販売個数
商品Aと商品Bの販売個数

回帰係数を求める式

回帰係数は、以下の計算式で求められます。

回帰係数 = 相関係数 ×( 商品Bの標準偏差 ÷ 商品Aの標準偏差 )

回帰係数を求めるには、はじめに「相関係数」を求める必要があります。相関係数の求め方は「5分で分かる!相関係数の求め方」をご参照ください。(例題も同じです)相関係数を求める過程で、商品Aと商品Bの標準偏差も求めることができます。

回帰係数の計算

相関係数の計算おつかれさまでした!
求めた相関係数と、商品Aと商品Bの標準偏差は以下の値になっていると思います。

相関係数:0.87
商品A の 標準偏差: 21.56
商品B の 標準偏差: 26.42

あとは、回帰係数を求める式 相関係数 ×( 商品Bの標準偏差 ÷ 商品Aの標準偏差 ) に当てはめて、計算するだけです。

0.87 × ( 26.42 ÷ 21.56 ) = 回帰係数:1.06

切片の計算

せっかくなので、切片も計算してみましょう。切片は、以下の計算式で求められます。

切片 = 商品Bの平均 -( 回帰係数 × 商品Aの平均 )

回帰係数は先ほど求めた「1.06」、商品Aの平均は「40.8」、商品Bの平均は「59.6」になりますので、これを式に当てはめて計算します。

59.6 - ( 1.06 × 40.8 ) = 切片:16.3

商品Bの売れ行きの予測

回帰係数と切片が求められましたので、回帰直線は「商品B = 商品A × 1.06 + 16.3」となります。

例えば、商品Aを100個注文した取引先には、商品Bが「100 × 1.06 + 16.3 = 122」個くらい売れると予測することができます。

「R」3行で出来る!回帰係数の求め方

手計算で回帰係数を求めるのはかなり大変ですが、統計解析ソフトの「R」を使えば、わずか3行のコマンドを入力するだけで、回帰係数を求められます。

lm関数の「~」の左側に予測したい変数(商品B)、右側に予測に使われる変数(商品A)を設定して実行します。商品Aの下に表示されている値が回帰係数、(Intercept) の下の値が切片です。

> 商品A = c(12, 38, 28, 50, 76)
> 商品B = c(28, 35, 55, 87, 93)
> lm( 商品B ~ 商品A )

Call:
lm(formula = 商品B ~ 商品A)

Coefficients:
(Intercept)        商品A  
     16.329        1.061  
 

 
また、summary関数を合わせて使うことで、より詳しい結果を表示できます。

> summary(lm(商品B~商品A))

Call:
lm(formula = 商品B ~ 商品A)

Residuals:
      1       2       3       4       5 
 -1.056 -21.630   8.975  17.643  -3.932 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)  16.3290    16.3574   0.998    0.392  
商品A         1.0606     0.3545   2.992    0.058 .
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 17.09 on 3 degrees of freedom
Multiple R-squared:  0.749,	Adjusted R-squared:  0.6653 
F-statistic: 8.952 on 1 and 3 DF,  p-value: 0.05803

 
簡単に回帰直線を描くこともできます。

> plot(商品A,商品B)
> abline(lm(商品B~商品A))

終わりに

冒頭にも書きましたが、回帰分析は統計学を使った分析の中でも、特に仕事に活用しやすい分析手法だと思います。実際に回帰分析を行う手順は「Rによるやさしい統計学」がとても参考になりました。この書籍はRの使い方を覚えながら、統計学を基礎から学べる内容になっていますので、統計学をこれから学びたい方にもオススメです。

コメント

  1. Jinchuan より:

    懐かしい内容が満載ですね。
    また、解説が非常にわかりやすく部下への説明が簡単になりました。
    ありがとうございます。

  2. salasa より:

    とても分かりやすく、助かりました。
    ありがとうございます。

    • あぱーブログ あぱーブログ より:

      >salasaさん
      こちらこそコメントありがとうございます。
      この記事がお役にたてて良かったです。

タイトルとURLをコピーしました