数据分析及曲线拟合
在生产管理和科学研究中,我们经常遇到各种不同的变量,有些变量间存在着一定的关系。
举例1:人的血压Y与年龄x的关系。
举例2: 人的身高Y和体重x的关系
变量之间这种既有关,但又不能由一个或几个变量之值完全确定出另一个变量之值的关系称为相关关系。处理这种变量关系就需要用到回归分析。
回归分析:
是研究和处理变量与变量之间相关关系的数学方法。
通过观察以及经验分析,根据部分变量的值,来预测未知变量。
回归分析一般可分为以下几种:
一.一元线性回归分析
主要是处理两个变量x与y之间的相关关系,
一元线性回归分析,需要解决:
(1)求变量y与x之间的回归直线方程
(2)判断变量y和x之间是否确为线性关系
(3)根据一个变量的值,预测或控制另一变量的取值
求解步骤:
1)推测回归函数的形式
2)建立回归模型
假设对于x的每一个值都有Y~N(α+βx,σ
2
),其中α,β,σ
2
都是独立于x的未知参数
记ε=Y-(α+βx),那么有
3)回归系数的最小二乘估计
利用最小二乘法计算参数α和β
即可得到线性回归方程
4)误差分析(具体略)
二.一元非线性回归分析
有时两个变量间的关系不是线性相关关系,而是某种曲线关系,就必须用一条曲线来拟合两个变量之间的依赖关系。通常解决方法是通过
变量替换
把问题转化为一元或多元线性回归问题后,用线性回归分析的方法建立回归模型,并进行预测。
常见的函数替换
1.双曲线函数
2.指数函数
3.S型函数
三.数据拟合
常见的数据拟合方式有:
-
插值法:是以实际需求为依据,选择不同的插值公式,得到所求的拟合函数。
-
平滑法:是一种保持凸度的拟合方法
-
最小二乘法:是一种依靠最小化误差平方和来逼近数据的拟合方法
matlab cftool工具箱使用
cftool工具箱是matlab提供的一种操作及其简便的数据拟合工具箱。
拟合方式有以下几种
- Custom Equations:用户自定义的函数类型
- Exponential:指数逼近,有2种类型, aexp(bx) 、 aexp(bx) + cexp(dx)
- Fourier:傅立叶逼近,有7种类型,基础型是 a0 + a1cos(xw) + b1sin(xw)
- Gaussian:高斯逼近,有8种类型,基础型是 a1*exp(-((x-b1)/c1)^2)
- Interpolant:插值逼近,有4种类型,linear(线性插值)、nearest neighbor(最近邻点插值)、cubic spline(最近邻点插值), Hermite (插值多项式)
- Polynomial:多项式逼近,有9种类型,linear ~、quadratic ~、cubic ~、4-9th degree ~
- Power:幂逼近,有2种类型,ax^b 、ax^b + c
- Rational:有理数逼近,分子、分母共有的类型是linear ~、quadratic ~、cubic ~、4-5th degree~;此外,分子还包括constant型
- Smoothing Spline:平滑样条
- Sum of Sin Functions:正弦曲线逼近,有8种类型,基础型是 a1sin(b1x + c1)
- Weibull:只有一种
根据误差分析选用最适合的拟合方式进行拟合即可
版权声明:本文为m0_51076536原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。