统计/曲线拟合
在尝试评估收集的数据时,通常会出现模式,例如在绘制 的光线光学散点图时,会出现 -1 斜率。通常的目标是找到一个“拟合”数据的数学函数。也就是说,一个函数,它的值在相应的自变量和因变量的值上接近数据值。这通常被称为“最小二乘”,其原因将在后面解释。
一家商店以 P=3.49 的价格出售某种商品,每天平均销售量为 V=100。因此,总收入 T=P 乘以 V=349.00 ..... 如果价格降低,那么也许会卖出更多商品,但 T 可能更多或更少。显然,如果 P=0,那么 T 也会为零。以下是结果
P V T 2.99 130 388.70 3.29 123 404.67 3.49 100 349.00
显然,“最佳”价格介于 2.99 和 3.49 之间。 ..... 曲线拟合 提供了 T 与 P 之间的方程式,用于比较许多可用的模型。
线性模型基于“最佳”直线。使用可以执行 回归 的计算器,我们发现对于上述数据,显示 T 与 P 之间关系的图的最近直线是
- T=605.268605263 - 68.9289473684 * P,并且该模型的相关性显示为约 60%。
让我们更详细地研究它
P Actual T Calculated T Difference Difference2
2.99 388.70 399.17105263159 - 10.4710526316 109.642943214 3.29 404.67 378.49236842106 26.1776315789 685.268395081 3.49 349.00 364.70657894738 - 15.7065789474 246.696622231
将差异加起来,我们发现它们的总和几乎为零,表明这是“最佳”线性模型。对负数求平方总是得到正数。因此,平方和将告诉我们拟合优度。这里,平方和为 1041.60796053,我们可以比较不同的模型,最终选择平方和最小的模型。
如果你没有计算器或可以执行回归的计算机,那么.....
在直线方程 y=a+b*x 中寻找 a 和 b
在上面的示例中,我们有
x x2 y y2 xy 2.99 8.9401 388.70 151087.69 1162.213 3.29 10.8241 404.67 163757.8089 1331.3643 3.49 12.1801 349.00 121801 1218.01 ---- ------- ------- ----------- --------- 9.77 31.9443 1142.37 436646.4989 3711.5873
我们有:n = 点数 = 3
ax=x 的平均值=9.77/3=3.256
ay=y 的平均值=1142.37/3=380.79
x1=x 的总和=9.77
x2=x2 的总和=31.9443
y1=y 的总和=1142.37
y2=y2 的总和=436646.4989
s1=xy 的总和=3711.5873
z1=s1-(x1*y1/n)=3711.5873-(9.77*1142.37/3)= -8.731
z2=x2-(x12/n)=31.9443-9.772/3=0.126
b=z1/z2=-68.9289473682
a=ay-b*ax=380.79-(-68.9289473682)*3.256=605.268605263
Thus we have y=605.268605263-68.92894736828*x as the best line to fit the given points of this example.
如果我们有 n 个点,那么 (n-1) 次多项式将精确拟合这 n 个点。在这个示例中,我们有 3 个点,2 次多项式(抛物线)应该给我们一个精确的拟合。计算器提供了方程
(-663.1666666653)x2 + 4217.91999999x-6294.10448332,给我们
P Actual T Calculated T Difference
2.99 388.70 388.6999999956 4.4E-9 = zero plus rounding error 3.29 404.67 404.6699999951 4.9E-9 = zero plus rounding error 3.49 349.00 348.999999995 5.0E-8 = zero plus rounding error
这是一个完美的拟合,平方和最小表明应该使用此模型。
许多其他模型中的一些基于指数函数、对数以及自变量和/或因变量的各种操作。通常,“最佳拟合”是提供平方和最小的拟合。另外,当图上的某些点比其他点更重要(例如,可能是端点)时,可以使用数据的加权。
- 注意:一些计算器可能要求曲线拟合连续的、等间隔的自变量。始终将原始图与“拟合”图进行比较。