【回歸直線的完整公式】在統(tǒng)計(jì)學(xué)中,回歸分析是一種用于研究變量之間關(guān)系的方法。其中,回歸直線是最基礎(chǔ)、最常用的模型之一,用于描述一個(gè)變量(自變量)與另一個(gè)變量(因變量)之間的線性關(guān)系。本文將總結(jié)回歸直線的完整公式,并通過表格形式清晰展示其組成部分。
一、回歸直線的基本概念
回歸直線是通過最小二乘法擬合出的一條直線,用來表示兩個(gè)變量之間的最佳擬合關(guān)系。其數(shù)學(xué)表達(dá)式為:
$$
\hat{y} = a + bx
$$
其中:
- $\hat{y}$:預(yù)測值(因變量的估計(jì)值)
- $x$:自變量
- $a$:截距項(xiàng)(當(dāng) $x=0$ 時(shí)的預(yù)測值)
- $b$:斜率(表示 $x$ 每增加一個(gè)單位,$\hat{y}$ 的變化量)
二、回歸直線的完整公式推導(dǎo)
為了計(jì)算回歸直線的參數(shù) $a$ 和 $b$,需要使用以下公式:
1. 斜率 $b$ 的計(jì)算公式:
$$
b = \frac{n\sum xy - (\sum x)(\sum y)}{n\sum x^2 - (\sum x)^2}
$$
或等價(jià)地:
$$
b = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}
$$
其中:
- $n$:數(shù)據(jù)點(diǎn)的數(shù)量
- $\bar{x}$:自變量的平均值
- $\bar{y}$:因變量的平均值
2. 截距 $a$ 的計(jì)算公式:
$$
a = \bar{y} - b\bar{x}
$$
三、關(guān)鍵公式總結(jié)表
| 公式名稱 | 公式表達(dá)式 |
| 回歸直線方程 | $\hat{y} = a + bx$ |
| 斜率 $b$ | $b = \frac{n\sum xy - (\sum x)(\sum y)}{n\sum x^2 - (\sum x)^2}$ |
| 或 $b$ 的另一種形式 | $b = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}$ |
| 截距 $a$ | $a = \bar{y} - b\bar{x}$ |
四、應(yīng)用示例
假設(shè)我們有如下數(shù)據(jù):
| x | y |
| 1 | 2 |
| 2 | 3 |
| 3 | 4 |
| 4 | 5 |
計(jì)算步驟如下:
1. 計(jì)算 $\sum x = 10$, $\sum y = 14$
2. 計(jì)算 $\sum xy = 1×2 + 2×3 + 3×4 + 4×5 = 2 + 6 + 12 + 20 = 40$
3. 計(jì)算 $\sum x^2 = 12 + 22 + 32 + 42 = 1 + 4 + 9 + 16 = 30$
4. $n = 4$
代入公式得:
$$
b = \frac{4×40 - 10×14}{4×30 - 10^2} = \frac{160 - 140}{120 - 100} = \frac{20}{20} = 1
$$
$$
\bar{x} = \frac{10}{4} = 2.5,\quad \bar{y} = \frac{14}{4} = 3.5
$$
$$
a = 3.5 - 1×2.5 = 1
$$
最終回歸直線為:
$$
\hat{y} = 1 + 1x
$$
五、總結(jié)
回歸直線是數(shù)據(jù)分析中非常重要的工具,能夠幫助我們理解變量之間的線性關(guān)系。掌握其完整公式不僅有助于理論學(xué)習(xí),也對(duì)實(shí)際應(yīng)用具有重要意義。通過上述表格和示例,可以更直觀地理解回歸直線的構(gòu)建過程及其數(shù)學(xué)表達(dá)方式。


