手撸机器学习算法线性回归

如果说感知机是最最最简单的分类算法，那么线性回归就是最最最简单的回归算法，所以这一篇我们就一起来快活的用两种姿势手撸线性回归吧

算法介绍

线性回归通过超平面拟合数据点，经验误差一般使用MSE（均平方误差），优化方法为最小二乘法，算法如下：

假设输入数据为X，输出为Y，为了简单起见，这里的数据点为一维数据（更好可视化，处理方式没区别）；
MSE公式为：(\frac{1}{N}\sum_{i=1}^{N}(w*x_i+b-y_i)^2)；
最小二乘法：最小指的是目标是min，二乘指的就是MSE中误差的二次方，公式为：(min\frac{1}{N}\sum_{i=1}^{N}(w*x_i+b-y_i)^2)；
由于目标是查找拟合最好的超平面，因此依然定义变量w和b；
对于w和b的求解有两种方式：
a. 列出最小化的公式，利用优化求解器求解：
b. 基于已知的X、Y，未知的w、b构建MSE公式；
定义最小化MSE的目标函数；
7.利用求解器直接求解上述函数得到新的w和b；

对经验误差函数求偏导并令其为0推导出w和b的解析解：

基于最小化MSE的优化问题可以直接推导出w和b的计算方法；
基于推导出的计算方法直接计算求解；

利用求解器求解

利用求解器求解可以看作就是个列公式的过程，把已知的数据X和Y，未知的变量w和b定义好，构建出MSE的公式，然后丢到求解器直接对w和b求偏导即可，相对来说代码繁琐，但是过程更简单，没有任何数学推导；

代码实现

初始化数据集

X = np.array([1.51, 1.64, 1.6, 1.73, 1.82, 1.87])
y = np.array([1.63, 1.7, 1.71, 1.72, 1.76, 1.86])

定义变量符号

所谓变量指的就是那些
2c58
需要求解的部分，次数就是超平面的w和b；

w,b = symbols('w b',real=True)

定义经验误差函数MSE

RDh = 0
for xi,yi in zip(X,y):
RDh += (yi - (w*xi+b))**2
RDh = RDh / len(X)

定义求解函数

此处就是对w和b求偏导；

eRDHw = diff(RDh,w)
eRDHb = diff(RDh,b)

求解w和b

ans = solve((eRDHw,eRDHb),(w,b))
w,b = ans[w],ans[b]

运行结果

手撸机器学习算法线性回归

完整代码

from sympy import symbols, diff, solve
import numpy as np
import matplotlib.pyplot as plt

'''
线性回归拟合wx+b直线；

最小二乘法指的是优化求解过程是通过对经验误差（此处是均平方误差）求偏导并令其为0以解的w和b；
'''

# 数据集 D X为父亲身高，Y为儿子身高
X = np.array([1.51, 1.64, 1.6, 1.73, 1.82, 1.87])
y = np.array([1.63, 1.7, 1.71, 1.72, 1.76, 1.86])
# 构造符号
w,b = symbols('w b',real=True)
# 定义经验误差计算公式：(1/N)*sum(yi-(w*xi+b))^2)
RDh = 0
for xi,yi in zip(X,y):
RDh += (yi - (w*xi+b))**2
RDh = RDh / len(X)
# 对w和b求偏导：求偏导的结果是得到两个结果为0的方程式
eRDHw = diff(RDh,w)
eRDHb = diff(RDh,b)
# 求解联立方程组
ans = solve((eRDHw,eRDHb),(w,b))
w,b = ans[w],ans[b]print('使得经验误差RDh取得最小值的参数为：'+str(ans))

plt.scatter(X,y)
x_range = [min(X)-0.1,max(X)+0.1]
y_range = [w*x_range[0]+b,w*x_range[1]+b]
plt.plot(x_range,y_range)

plt.show()

推导公式求解

与利用优化器求解的区别在于针对(min\frac{1}{N}\sum_{i=1}^{N}(w*x_i+b-y_i)^2)对(w)和(b)求偏导并令其为0，并推导出w和b的计算公式是自己推导的，还是由优化器完成的，事实上如果自己推导，那么最终代码实现上会非常简单（推导过程不会出现在代码中）；
w和b的求解公式推导

首先，我们的优化目标为：

[min \frac{1}{N}\sum_{i=1}^{N}(w*x_i+b-y_i)^2
]

去除公式中无关的常量部分：

[min \sum_{i=1}^{N}(w*x_i+b-y_i)^2
]

由于一般w是向量，而b为标量，因此通常会将w和b组成[w b]，x变为[x 1]来统一处理w和b，调整后如下：

[\sum_{i=1}^{N}(wx_i^T-y_i)^2
]

上式把平方拆开有：

[\sum_{i=1}^{N}(ww^Tx_ix_i^T-2wx_i^Ty_i+y_i^2)
]

对于w（注意此时w为原w和b的组合）求偏导过程如下：

[\begin{equation*}
\begin{split}
\frac{\partial \sum_{i=1}^{N}(ww^Tx_ix_i^T-2wx_i^Ty_i+y_i^2)}{\partial w} &= 2w^Tx_ix_i^T-2x_i^Ty_i \
&= 0 \
\end{split}
\end{equation*}
]

上式变形后有：

[2w^Tx_ix_i^T - 2x_i^Ty_i = 0 \
w^Tx_ix_i^T = x_i^Ty_i \
w^T = (x_ix_i^T)^{-1}x_i^Ty_i
]

由于此处的w其实是w和b的组合，因此通过这一次推导就得到了w和b两个求解方法；

代码实现

构造数据集

X = np.array([1.51,1.64,1.6,1.73,1.82,1.87]).reshape(-1,1)
y = np.array([1.63,1.7,1.71,1.72,1.76,1.86])

为X增加元素全为1的一列用于和b的计算

ones = np.ones(X.shape[0]).reshape(-1,1)
X = np.hstack((ones,X))

通过求解公式求解w和b

w = np.linalg.inv(self.X.T @ self.X) @ self.X.T @ self.y
w,b = w[1:],w[0]

导航菜单

搜索

算法介绍

利用求解器求解

代码实现

初始化数据集

定义变量符号

定义经验误差函数MSE

定义求解函数

求解w和b

运行结果

完整代码

推导公式求解

代码实现

构造数据集

为X增加元素全为1的一列用于和b的计算

通过求解公式求解w和b

随机推荐

精选留言

友情链接

最新评论

作者信息

文章导航

热门文章

导航菜单

搜索

手撸机器学习算法 线性回归

算法介绍

利用求解器求解

代码实现

初始化数据集

定义变量符号

定义经验误差函数MSE

定义求解函数

求解w和b

运行结果

完整代码

推导公式求解

代码实现

构造数据集

为X增加元素全为1的一列用于和b的计算

通过求解公式求解w和b

随机推荐

精选留言

友情链接

最新评论

作者信息

文章导航

热门文章

手撸机器学习算法线性回归