跳转到内容

统计/曲线拟合

来自维基教科书,开放的书籍,开放的世界

无论何时尝试评估收集到的数据,通常都会出现模式,例如在绘制 的散点图时,会出现 -1 的斜率。在光线光学中,通常的目标是找到一个“拟合”数据的数学函数。也就是说,一个函数,其值在相应的自变量和因变量值处接近数据值。这通常被称为“最小二乘法”,其原因将在后面解释。

销售示例

[编辑 | 编辑源代码]

一家商店以 P=3.49 的价格出售某商品,每天平均售出该商品的数量(销量)为 V=100。因此,收到的总金额 T=P 乘以 V=349.00 ..... 如果价格降低,那么可能会有更多商品被出售,但 T 可能会有所增加或减少。显然,如果 P=0,那么 T 也将为零。以下是结果

        P          V           T
      2.99        130        388.70
      3.29        123        404.67
      3.49        100        349.00

显然,“最佳”价格介于 2.99 和 3.49 之间。 ..... 曲线拟合 为 T 相对于 P 提供了一个方程,用于比较众多可用的模型中的每一个。

线性模型

[编辑 | 编辑源代码]

线性模型基于“最佳”直线。使用可以进行 回归 的计算器,我们发现,对于上述数据,显示 T 相对于 P 的图形中最接近的直线是

T=605.268605263 - 68.9289473684 * P,并且该模型的相关性约为 60%。

让我们更详细地研究一下

   P    Actual T   Calculated T       Difference     Difference2
2.99 388.70 399.17105263159 - 10.4710526316 109.642943214 3.29 404.67 378.49236842106 26.1776315789 685.268395081 3.49 349.00 364.70657894738 - 15.7065789474 246.696622231

将差异加起来,我们发现它们的总和几乎为零,这表明它是“最佳”线性模型。负数的平方总是给出正数。因此,平方和将为我们提供拟合优度的指标。这里,平方和为 1041.60796053,我们可以比较不同的模型,最终选择具有最小二乘法的模型。


如果您没有可以进行回归的计算器或计算机,那么.....

计算最适合给定点的直线

[编辑 | 编辑源代码]

在直线方程 y=a+b*x 中寻找 a 和 b

在上面的示例中,我们有

    x       x2      y       y2             xy

  2.99   8.9401  388.70  151087.69     1162.213
  3.29  10.8241  404.67  163757.8089   1331.3643
  3.49  12.1801  349.00  121801        1218.01
  ----  ------- -------  -----------   ---------
  9.77  31.9443 1142.37  436646.4989   3711.5873

我们有:n = 点数 = 3
ax=x 的平均值=9.77/3=3.256
ay=y 的平均值=1142.37/3=380.79
x1=x 的总和=9.77
x2=x2 的总和=31.9443
y1=y 的总和=1142.37
y2=y2 的总和=436646.4989
s1=xy 的总和=3711.5873
z1=s1-(x1*y1/n)=3711.5873-(9.77*1142.37/3)= -8.731
z2=x2-(x12/n)=31.9443-9.772/3=0.126
b=z1/z2=-68.9289473682

a=ay-b*ax=380.79-(-68.9289473682)*3.256=605.268605263

Thus we have y=605.268605263-68.92894736828*x as the best line to fit the given points of this example.

抛物线模型

[编辑 | 编辑源代码]

如果我们有 n 个点,那么 (n-1) 次多项式将精确地拟合这 n 个点。在本示例中,我们给出了 3 个点,2 次多项式(抛物线)应该可以精确拟合。计算器提供了方程
(-663.1666666653)x2 + 4217.91999999x-6294.10448332,得到

   P    Actual T   Calculated T       Difference
2.99 388.70 388.6999999956 4.4E-9 = zero plus rounding error 3.29 404.67 404.6699999951 4.9E-9 = zero plus rounding error 3.49 349.00 348.999999995 5.0E-8 = zero plus rounding error

这是一个完美的拟合,最小二乘法表明应该使用此模型。

其他模型

[编辑 | 编辑源代码]

许多其他模型中的一些基于指数函数、对数以及对自变量和/或因变量的不同操作。通常,“最佳拟合”是提供最小二乘法的拟合。此外,当图形上的某些点比其他点更重要时(例如,可能,例如,端点),可以使用数据加权。

注意:一些计算器可能需要在曲线拟合中使用连续的、等间距的自变量。始终将原始图形与“拟合”图形进行比较。
华夏公益教科书