一、 先说我对这个题目的理解
直线的x,y方程是这样的:y = kx+b, k就是斜率.
求线性回归斜率, 就是说
有这么一组(x, y)的对应值——样本。如果有四组,就说样本量是4.
根据这些样本,做“线性回归”,最终求出一条直线(即y = kx + b的k值和b值),使得样本里的各个点(x, y) “尽可能的”落到直线(或者直线附近)上。
二、 python解题需要安装的包
实际解题主要用到的python库是pandas. 解题算法是“最小二乘法”,这用到了pandas的ols函数。
我的系统是ubuntu14.04.
实际实验过程如下:
$ sudo pip install numpy
$ sudo pip install pandas
安装pandas的依赖包(使用pandas.ols函数就必须安装这个依赖包):
$ sudo pip install statsmodels
如果发现安装失败,则需要安装系统依赖库先:
在http://www.netlib.org/lapack/ 下载lapack-3.6.0的包,然后:
$ cd lapack-3.6.0
$ mv make.inc.example make.inc
$ sudo apt-get install gfortran
把makefile文件中的:
lib: lapacklib tmglib
改为:
lib: blaslib variants lapacklib tmglib