统计/曲线拟合
无论何时尝试评估收集到的数据,通常都会出现模式,例如在绘制 的散点图时,会出现 -1 的斜率。在光线光学中,通常的目标是找到一个“拟合”数据的数学函数。也就是说,一个函数,其值在相应的自变量和因变量值处接近数据值。这通常被称为“最小二乘法”,其原因将在后面解释。
一家商店以 P=3.49 的价格出售某商品,每天平均售出该商品的数量(销量)为 V=100。因此,收到的总金额 T=P 乘以 V=349.00 ..... 如果价格降低,那么可能会有更多商品被出售,但 T 可能会有所增加或减少。显然,如果 P=0,那么 T 也将为零。以下是结果
P V T 2.99 130 388.70 3.29 123 404.67 3.49 100 349.00
显然,“最佳”价格介于 2.99 和 3.49 之间。 ..... 曲线拟合 为 T 相对于 P 提供了一个方程,用于比较众多可用的模型中的每一个。
线性模型基于“最佳”直线。使用可以进行 回归 的计算器,我们发现,对于上述数据,显示 T 相对于 P 的图形中最接近的直线是
- T=605.268605263 - 68.9289473684 * P,并且该模型的相关性约为 60%。
让我们更详细地研究一下
P Actual T Calculated T Difference Difference2
2.99 388.70 399.17105263159 - 10.4710526316 109.642943214 3.29 404.67 378.49236842106 26.1776315789 685.268395081 3.49 349.00 364.70657894738 - 15.7065789474 246.696622231
将差异加起来,我们发现它们的总和几乎为零,这表明它是“最佳”线性模型。负数的平方总是给出正数。因此,平方和将为我们提供拟合优度的指标。这里,平方和为 1041.60796053,我们可以比较不同的模型,最终选择具有最小二乘法的模型。
如果您没有可以进行回归的计算器或计算机,那么.....
在直线方程 y=a+b*x 中寻找 a 和 b
在上面的示例中,我们有
x x2 y y2 xy 2.99 8.9401 388.70 151087.69 1162.213 3.29 10.8241 404.67 163757.8089 1331.3643 3.49 12.1801 349.00 121801 1218.01 ---- ------- ------- ----------- --------- 9.77 31.9443 1142.37 436646.4989 3711.5873
我们有:n = 点数 = 3
ax=x 的平均值=9.77/3=3.256
ay=y 的平均值=1142.37/3=380.79
x1=x 的总和=9.77
x2=x2 的总和=31.9443
y1=y 的总和=1142.37
y2=y2 的总和=436646.4989
s1=xy 的总和=3711.5873
z1=s1-(x1*y1/n)=3711.5873-(9.77*1142.37/3)= -8.731
z2=x2-(x12/n)=31.9443-9.772/3=0.126
b=z1/z2=-68.9289473682
a=ay-b*ax=380.79-(-68.9289473682)*3.256=605.268605263
Thus we have y=605.268605263-68.92894736828*x as the best line to fit the given points of this example.
如果我们有 n 个点,那么 (n-1) 次多项式将精确地拟合这 n 个点。在本示例中,我们给出了 3 个点,2 次多项式(抛物线)应该可以精确拟合。计算器提供了方程
(-663.1666666653)x2 + 4217.91999999x-6294.10448332,得到
P Actual T Calculated T Difference
2.99 388.70 388.6999999956 4.4E-9 = zero plus rounding error 3.29 404.67 404.6699999951 4.9E-9 = zero plus rounding error 3.49 349.00 348.999999995 5.0E-8 = zero plus rounding error
这是一个完美的拟合,最小二乘法表明应该使用此模型。
许多其他模型中的一些基于指数函数、对数以及对自变量和/或因变量的不同操作。通常,“最佳拟合”是提供最小二乘法的拟合。此外,当图形上的某些点比其他点更重要时(例如,可能,例如,端点),可以使用数据加权。
- 注意:一些计算器可能需要在曲线拟合中使用连续的、等间距的自变量。始终将原始图形与“拟合”图形进行比较。