向上
本节包含拉格朗日形式主义的几个理论发展,这些发展对于解决问题并不直接必要。但是,这些考虑有助于更深入地理解理论并回答一些重要问题。
在力学的拉格朗日表述中,轨迹  由作用泛函
 由作用泛函 ![{\displaystyle S[{\vec {q}}(t)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dcd1978fd9119c5aa2f2d7f0bbc0e5db8d7ba218) 应该有一个极值来决定。(并非总是这样,轨迹是最小作用;在某些情况下,它可能只是一个极值,即泛函导数
 应该有一个极值来决定。(并非总是这样,轨迹是最小作用;在某些情况下,它可能只是一个极值,即泛函导数  为零。) 这个条件被称为作用原理。到目前为止,您应该熟悉从作用原理推导出运动方程的数学过程。
 为零。) 这个条件被称为作用原理。到目前为止,您应该熟悉从作用原理推导出运动方程的数学过程。
因此,在这一点上,您应该习惯于每个机械系统的正确运动方程确实遵循作用原理,如果拉格朗日函数被适当地选择。然而,您可能仍然感到困惑,牛顿定律等价于某个泛函的极值条件。您可能会问自己:为什么这可能?
这里有一个解释可能会有所帮助。让我们考虑一个简单的机械系统:一个质量为  的质点,在一个维度上运动,坐标为
 的质点,在一个维度上运动,坐标为  ,在一个势能为
,在一个势能为  的力场中。(同样的考虑很容易推广到多个维度和多个坐标的情况。)假设
 的力场中。(同样的考虑很容易推广到多个维度和多个坐标的情况。)假设  是根据牛顿定律正确的轨迹,
 是根据牛顿定律正确的轨迹,

我们如何使用泛函 ![{\displaystyle S[x]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e2ec9a5aa2223a25c0c76570fe05c7b812d796a0) 来表达轨迹
 来表达轨迹  是正确的那个?一种方法是要求
 是正确的那个?一种方法是要求  与
 与  的偏差处处为零。这可以用泛函表示为
 的偏差处处为零。这可以用泛函表示为
![{\displaystyle S_{1}[x]=\int _{t_{1}}^{t_{2}}[x(t)-x_{0}(t)]^{2}dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8f9fa3be3689e4ea2aff93274e23c41d374b07d8)
很明显,泛函 ![{\displaystyle S_{1}[x]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8d15b60bd72cd05f55c4c7299a961b90042816b6) 仅当
 仅当  对所有
 对所有  成立时,才取到最小值(显然最小值为 0)。这展示了如何使用泛函来表达函数的一些条件:泛函
 成立时,才取到最小值(显然最小值为 0)。这展示了如何使用泛函来表达函数的一些条件:泛函 ![{\displaystyle S_{1}[x]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8d15b60bd72cd05f55c4c7299a961b90042816b6) 衡量了
 衡量了  与
 与  在整个过程中的偏差。最小的偏差是完全没有偏差;因此,泛函
 在整个过程中的偏差。最小的偏差是完全没有偏差;因此,泛函 ![{\displaystyle S_{1}[x(t)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/936ff279373636aea5ae564dc5f3e4f0979df294) 的最小值出现在轨迹
 的最小值出现在轨迹  上,该轨迹与
 上,该轨迹与  完全没有偏差。
 完全没有偏差。
另一种类似的方法是使用泛函来指定轨迹
![{\displaystyle S_{2}[x]=\int _{t_{1}}^{t_{2}}[{\dot {x}}(t)-{\dot {x}}_{0}(t)]^{2}dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7ff7308858a2c765e9e9da8d416facf9010af49a)
该泛函与边界条件  联立,仅当
 联立,仅当  对所有
 对所有  成立时,才取到最小值。
 成立时,才取到最小值。
不可否认,泛函 ![{\displaystyle S_{1}[x],S_{2}(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fa9fcbc37ec5148dd853a58ab4bd68925ef2c3a1) 无法帮助我们表述力学的规律,因为它们已经显式地包含了正确的轨迹
 无法帮助我们表述力学的规律,因为它们已经显式地包含了正确的轨迹  。现在,我们将从
。现在,我们将从 ![{\displaystyle S_{2}[x]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fb416649577274c80b47d7c73d227a7e2897f055) 开始构建另一个泛函,
 开始构建另一个泛函, ![{\displaystyle S_{3}[x]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5f91fca41e9cc61ece2f8fc8d1a2fd633f1eaa75) ,试图消除对
,试图消除对  的显式依赖。
 的显式依赖。
让我们重写 ![{\displaystyle S_{2}[x]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fb416649577274c80b47d7c73d227a7e2897f055) 为
 为
![{\displaystyle S_{2}[x]=\int _{t_{1}}^{t_{2}}[{\dot {x}}^{2}-2{\dot {x}}{\dot {x}}_{0}+{\dot {x}}_{0}^{2}]dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f6c3004af7d90fd67f4865cf6653b42fd94ab917)
第三项, ,是一个固定函数,当我们改变
,是一个固定函数,当我们改变  时不会改变。因此,我们可以从
 时不会改变。因此,我们可以从  中省略该项。此外,我们希望得到
 中省略该项。此外,我们希望得到  而不是
 而不是  ,因为这样我们就可以使用牛顿定律来求出正确的轨迹。所以让我们用分部积分法积分第二项
,因为这样我们就可以使用牛顿定律来求出正确的轨迹。所以让我们用分部积分法积分第二项

边界项  不会随着
 不会随着  而改变,因为
 而改变,因为  的边界值是固定的。因此,我们可以省略该项。最后,我们使用牛顿定律来用
 的边界值是固定的。因此,我们可以省略该项。最后,我们使用牛顿定律来用  替换
 替换 

现在我们*假设*轨迹 与正确轨迹
与正确轨迹 的偏差非常小,那么我们可以近似地写成
的偏差非常小,那么我们可以近似地写成
![{\displaystyle xU'(x_{0})=(x-x_{0})U'(x_{0})+x_{0}U'(x_{0})=U(x)-U(x_{0})+O[(x-x_{0})^{2}]+x_{0}U'(x_{0}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e8d00e4cff7c8fde7565a93489e3eb6f69ca388f)
在上述假设下,可以忽略 的二次项。项
的二次项。项 和
和 可以省略,因为它们与
可以省略,因为它们与 无关。因此我们发现泛函
无关。因此我们发现泛函 等价于以下泛函,直到与
等价于以下泛函,直到与 无关的非本质项
无关的非本质项
![{\displaystyle S_{3}[x]=\int _{t_{1}}^{t_{2}}[{\dot {x}}^{2}-2m^{-1}U(x)]dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/245b1936487259dc101381b170356d3981d41d76)
很明显, 等价于通常的拉格朗日量,直到系数
等价于通常的拉格朗日量,直到系数 。
。
通过这种方式,我们得到了一个函数 ![{\displaystyle S_{3}[x]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5f91fca41e9cc61ece2f8fc8d1a2fd633f1eaa75) ,当
,当  非常接近于
  非常接近于  时,该函数具有最小值;也就是说,它是一个局部最小值。这个新函数不显式地依赖于
 时,该函数具有最小值;也就是说,它是一个局部最小值。这个新函数不显式地依赖于  ,正如我们所期望的。需要付出的代价是,这个函数只对微小的偏离正确轨迹的情况有效。事实上,函数
,正如我们所期望的。需要付出的代价是,这个函数只对微小的偏离正确轨迹的情况有效。事实上,函数  可能还有其他最小值或最大值,而原始函数
 可能还有其他最小值或最大值,而原始函数  没有。对
 没有。对  正确性的唯一真正理由是运动方程与牛顿定律一致。
 正确性的唯一真正理由是运动方程与牛顿定律一致。
在简单的情况下,拉格朗日量等于动能和势能项的差。然而,需要选择一些坐标来描述这些项。然后,选择哪些变量作为坐标就完全无关紧要了;这些变量可以是长度、角度,或者长度和角度的任何函数(但不能是速度!)。换句话说,只要坐标能够充分描述每个质量点的可能位置,并且满足适当的约束条件,就可以使用任何坐标系,甚至只是某个坐标系的部分。因此,进入拉格朗日量的坐标被称为广义坐标。通常,为了方便起见,人们会选择广义坐标,以减少所需的计算量,或减少必要的约束条件的数量。
但是,你可能在问自己:为什么在拉格朗日形式主义中允许使用任意坐标呢?当然,我们知道,牛顿定律在不同的坐标系中是不一样的:例如,质量乘以加速度等于力,只有当加速度计算为  时才成立,其中
 时才成立,其中  是笛卡尔坐标
 是笛卡尔坐标  的向量。如果向量
 的向量。如果向量  由,比如说,半径
 由,比如说,半径  、方位角
、方位角  在
 在  平面内,以及坐标
 平面内,以及坐标  组成的话,这个公式就会不正确。但是,如果我们用变量
 组成的话,这个公式就会不正确。但是,如果我们用变量  来表示动能和势能,拉格朗日形式主义将能够很好地工作。运动方程将由欧拉-拉格朗日方程给出,
 来表示动能和势能,拉格朗日形式主义将能够很好地工作。运动方程将由欧拉-拉格朗日方程给出,

如前所述,人们说拉格朗日形式在坐标变换方面是协变的。
这种现象的原因可以用两种方式解释:更正式地,通过证明欧拉-拉格朗日方程在任意坐标变化下保持不变;或者更直观地,从几何角度来解决问题。
为简单起见,我们只考虑拉格朗日量为  的一维问题,其中
 的一维问题,其中  是一个广义坐标。同样的考虑很容易推广到多个坐标的情况。
 是一个广义坐标。同样的考虑很容易推广到多个坐标的情况。
假设选择新的坐标  来代替
 来代替  。新的坐标可以是旧坐标的函数。让我们考虑更一般的情况,即坐标的变化取决于时间(即,我们可以在不同的时间选择略微不同的坐标)。那么,新的坐标与旧坐标之间的关系可以用以下公式表示:
。新的坐标可以是旧坐标的函数。让我们考虑更一般的情况,即坐标的变化取决于时间(即,我们可以在不同的时间选择略微不同的坐标)。那么,新的坐标与旧坐标之间的关系可以用以下公式表示:

其中  是一个已知函数。
 是一个已知函数。
现在我们需要通过新的变量  及其导数
 及其导数  来表达旧的拉格朗日量
 来表达旧的拉格朗日量  。我们有
。我们有

其中,我们用带逗号的下标表示偏导数,例如  。这是物理学中常用的简化记法。
。这是物理学中常用的简化记法。
因此,用新变量  表示的拉格朗日量为
 表示的拉格朗日量为

新的变量 是一个很好的变量,如果它是旧变量的非平凡函数,即如果
是一个很好的变量,如果它是旧变量的非平凡函数,即如果 。 那么新的拉格朗日函数将是一个非平凡函数,它依赖于
。 那么新的拉格朗日函数将是一个非平凡函数,它依赖于 以及
以及 。 因此,我们假设
。 因此,我们假设 至少在
 至少在 的某个区间内。
的某个区间内。
现在让我们比较一下在旧坐标系和新坐标系中推导出的运动方程(EOM)。
旧的 EOM 可以写成

新的 EOM 是

让我们用 代替
 代替 来表达这个方程
 来表达这个方程
 
 

 
因此,新的 EOM 是

简化这个表达式,我们发现

我们发现新的运动方程在假设 的情况下,确实等价于旧的运动方程。
的情况下,确实等价于旧的运动方程。
上面给出的计算直观明确,但可能会让你想知道它为什么有效。下面是一个更直观的解释。
欧拉-拉格朗日方程表达了泛函 ![{\displaystyle S[q]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fad40c39a6f8d57c6accc6ff0e6f2541b2c1cb0) 在轨迹
 在轨迹  处取得极值。想象一个包含所有轨迹的空间,即一个巨大的空间,其中每个“点”代表一条完整的轨迹
 处取得极值。想象一个包含所有轨迹的空间,即一个巨大的空间,其中每个“点”代表一条完整的轨迹  。泛函
。泛函 ![{\displaystyle S[q]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fad40c39a6f8d57c6accc6ff0e6f2541b2c1cb0) 在某个“点”
 在某个“点” 处取得极值,该“点”对应于机械系统的实际轨迹。当我们改变坐标
 处取得极值,该“点”对应于机械系统的实际轨迹。当我们改变坐标  时,我们只是改变了对该轨迹空间的描述方式。但我们无法改变泛函
 时,我们只是改变了对该轨迹空间的描述方式。但我们无法改变泛函  在某个“点”
 在某个“点” 处取得极值的事实。我们只能改变对该“点”的描述方式。因此,在变量变换后,新的泛函
 处取得极值的事实。我们只能改变对该“点”的描述方式。因此,在变量变换后,新的泛函 ![{\displaystyle {\tilde {S}}[x]=S[q]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/997f969226ad0f32e0cdf4558ab665a427f7ce55) 仍然会在某个“点”
 仍然会在某个“点” 处取得极值,而这个“点”
 处取得极值,而这个“点” 必须对应于变量变换后的“点”
 必须对应于变量变换后的“点” 。极值的存在是泛函
。极值的存在是泛函  形状的几何特征,因此它与我们选择用坐标描述它的方式无关。
 形状的几何特征,因此它与我们选择用坐标描述它的方式无关。
让我们考虑一个简单的例子,在这个例子中我们使用函数而不是泛函。函数  在
 在  处取得最小值。我们可以改变坐标系,使用
 处取得最小值。我们可以改变坐标系,使用  来代替
 来代替  ,例如
,例如  。这是一个在区间
。这是一个在区间  上定义良好的变量变换,其中
 上定义良好的变量变换,其中  。在新坐标系中,函数
。在新坐标系中,函数  看起来像
 看起来像  。这个函数在
。这个函数在  处取得最小值,其中
 处取得最小值,其中  。但是,从几何学的角度来看,这与之前的函数完全相同,只是在不同的坐标系下观察。因此,最小值
。但是,从几何学的角度来看,这与之前的函数完全相同,只是在不同的坐标系下观察。因此,最小值  是在坐标系变换后旧的最小值
 是在坐标系变换后旧的最小值  。
。
这种等价性可以通过更正式的方式观察到。函数  取得最小值的条件是
 取得最小值的条件是

此条件等效于函数  的最小值的条件,即
 的最小值的条件,即  ,只要
,只要  。这就是为什么旧坐标中最小值的位置,
。这就是为什么旧坐标中最小值的位置, ,与新坐标中最小值的位置,
,与新坐标中最小值的位置, ,完全一致。
,完全一致。
类似地,当我们考虑泛函时,我们可以将 ![{\displaystyle {\tilde {S}}[x]=S[F(q)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/853370825b3af9d9925067aff25808eebf75482d) 在新坐标中的最小值的条件写成
 在新坐标中的最小值的条件写成

很明显,只要新变量定义良好,即  ,最小值的条件在变量变化下保持不变。
,最小值的条件在变量变化下保持不变。
另一个重要的问题是,对于给定的系统,是否只有一个拉格朗日量可以得到正确的运动方程。答案是,对于任何给定的系统,可以采用无限多个不同的拉格朗日量。
首先,始终可以将拉格朗日量乘以一个常数  ,还可以向拉格朗日量中添加一个任意的固定时间函数,
,还可以向拉格朗日量中添加一个任意的固定时间函数, 。修改后的拉格朗日量则为
。修改后的拉格朗日量则为  。项
。项  是“固定”的,因为它不依赖于
 是“固定”的,因为它不依赖于  。然后我们可以显式地对该项进行积分,并将修改后的作用量表示为
。然后我们可以显式地对该项进行积分,并将修改后的作用量表示为
![{\displaystyle {\tilde {S}}[q]=\alpha S[q]+\int _{t_{1}}^{t_{2}}F(t)dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/476bcbe0761e1e038b6b6ada0d58190872d1f8b1)
上面的最后一项只是一个数字。显然,这种对作用量的修改是无关紧要的:如果  是
 是 ![{\displaystyle S[q]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fad40c39a6f8d57c6accc6ff0e6f2541b2c1cb0) 的极值,那么它也是
 的极值,那么它也是 ![{\displaystyle {\tilde {S}}[q]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d8059c7cbb24866ee51f1323b82fe0e6f2541b2c1cb0) 的极值。在函数中添加一个常数不会改变极值的位置。
 的极值。在函数中添加一个常数不会改变极值的位置。
更一般地说,我们可以将一个任意的 *时间全导数* 加到拉格朗日量中

作用量由此得到的修改是
![{\displaystyle {\tilde {S}}[q]=S[q]+\int _{t_{1}}^{t_{2}}{\frac {d}{dt}}F(q,t)dt=S[q]+F(q_{2},t_{2})-F(q_{1},t_{1}),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ec2e0729e243e2c7dea63789ac6c502ca86c5895)
其中  是
 是  的边界值。由于这些值是固定的,在我们改变
 的边界值。由于这些值是固定的,在我们改变  时不会改变,作用量中的额外项再次是一个常数。因此,这种对作用量的修改不会改变运动方程。人们说,两个拉格朗日量如果相差一个时间全导数,那么它们是等效的。
 时不会改变,作用量中的额外项再次是一个常数。因此,这种对作用量的修改不会改变运动方程。人们说,两个拉格朗日量如果相差一个时间全导数,那么它们是等效的。
我们甚至可以允许函数  也依赖于
 也依赖于  的导数,以及
 的导数,以及  本身。然而,在这种情况下,还需要固定
 本身。然而,在这种情况下,还需要固定  在边界点
 在边界点  处对应导数的值。
 处对应导数的值。
因此,正如我们所见,给定物理系统的拉格朗日量并不唯一。“动能减去势能”这个公式只是一个简单的规则,可以得到一个好的拉格朗日量。
等效拉格朗日量的多样性并不局限于那些相差一个时间全导数或一个常系数的拉格朗日量。例如,拉格朗日量

会导致相同的运动方程,
![{\displaystyle [{\dot {q}}^{2}+2q{\ddot {q}}]q{\dot {q}}^{2}=0,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/db30c94e74f72be699a01dd1e1a7e857c55208f2)
尽管明显找不到一个函数  和一个常数
 和一个常数  使得
 使得  。(这样的函数最多会在拉格朗日量中产生一个额外的
。(这样的函数最多会在拉格朗日量中产生一个额外的  项,但不会产生对导数非线性的项。)
 项,但不会产生对导数非线性的项。)