跳转至内容

经典力学/拉格朗日

来自Wikibooks,开放世界的开放书籍

物理学 - 经典力学

上一页 上一级 下一页


使用力的力学考虑

[编辑 | 编辑源代码]

在牛顿力学中,机械系统总是由质点或刚体组成,它们受到已知力的作用。因此,必须指定系统的组成以及作用在各个物体上的力的性质。然后,为系统编写运动方程。以下是一些关于如何在牛顿力学中描述机械系统的示例(这些示例您在学校物理课上肯定都学过)。

  • 示例:自由质点。

这是所有机械系统中最简单的一个:一个不与任何其他物体相互作用且不受任何力的质点。引入坐标来描述质点的位置。由于力始终等于零,因此运动方程为。这些方程的通解描述了匀速直线运动:,等等。

  • 示例:两个质点用弹簧连接到静止的墙上。
Physics spring example
物理弹簧示例

两个物体可以沿一条线(轴)无摩擦地移动。质量通过弹簧连接到墙上,质量通过弹簧连接到质量。两个弹簧的弹簧常数均为,未拉伸长度为

为了写出运动方程,我们首先引入两个坐标,然后考虑作用在两个质量上的力。作用在质量上的力是左侧弹簧向左的力和右侧弹簧向右的力的和。作用在上的力是向左的。根据“弹簧”的定义,我们有。因此,我们写出两个质量的加速度的方程。

至此,我们完成了对系统的描述;现在我们需要针对特定的初始条件求解这些方程,并确定该系统的实际运动。

引入作用量原理

[编辑 | 编辑源代码]

机械系统的拉格朗日描述则有所不同:首先,我们不寻求给定初始条件下系统的演化,而是假设系统在两个不同时刻的位置是已知且固定的。为方便起见,我们将所有坐标(例如)收集到一个“广义坐标”数组中,并用表示。因此,我们对系统施加的“边界条件”为,其中是固定的数字。我们现在要问:系统在这两个时刻之间是如何运动的?拉格朗日描述的答案是:在这段时间内,系统必须以这样一种方式运动,使得积分的值最小,其中是一个已知的函数,称为拉格朗日函数拉格朗日量。例如,自由质点的拉格朗日量为

上面两个质量连接到墙上的例子,其拉格朗日量为

例如,根据拉格朗日描述,自由质点以这样的方式运动,使得函数 使积分的值最小,其中在时间处的取值是固定的。

原则上,要找到积分的最小值,需要对每条可能的轨迹计算该积分,然后选择使该积分值最小的“最优”轨迹。(当然,我们将学习并使用一种更有效的数学方法来确定这种“最优”轨迹,而不是尝试每组可能的函数。)上述积分的值称为对应于特定轨迹作用量。因此,要求积分应具有最小值通常被称为“最小作用量原理”或简称作用量原理

在这一点上,我们需要回答一个紧迫的问题

  • 为什么正确的轨迹不是通过考虑力来找到的,而是通过要求某个积分具有最小值来找到的?每个质点在运动时是如何“知道”它需要最小化某个积分的?

简短的答案是,如果拉格朗日量 选择正确,那么最小作用量原理在数学上等价于力的考虑。某个积分具有最小值(当积分选择正确时)的条件在数学上与牛顿的加速度方程相同。点质量可能“不知道”关于这个积分的任何信息。仅仅是在数学上方便地用一句话而不是很多句话来表述力学定律。(我们将在下面看到另一种更直观的解释。)

假设我们理解了如何将某个积分具有最小值的条件转化为加速度的方程。显然,由于运动方程不同,每个力学系统的积分形式都需要不同。然后第二个问题出现了

  • 我们如何找到对应于每个力学系统的拉格朗日函数

这是一个更复杂的问题,需要研究许多例子才能掌握这种方法。(简而言之:拉格朗日函数是动能减去势能。)

在考虑拉格朗日函数之前,我们将看看“最小作用量”的数学要求如何等价于上述例子中给出的运动方程。

泛函的变分

[编辑 | 编辑源代码]

函数是从数到数的映射;泛函是从函数到数的映射。泛函作用于函数通常用方括号表示,例如

泛函的随机例子,仅用于说明概念

原则上,泛函可以是任何将数字分配给任何函数的东西。在实践中,只有某些泛函是有趣的并且在物理学中得到应用。

由于作用积分将轨迹映射到数字,因此我们可以将其称为作用泛函。作用量原理表述如下:轨迹必须使得作用泛函作用于该轨迹的值在所有轨迹中最小。

这可能看起来类似于我们熟悉的机械平衡条件:坐标使得势能具有最小值。但是,存在一个关键的区别:当我们最小化势能时,我们改变三个数字直到找到最小值;但是当我们最小化一个泛函时,我们必须改变整个函数直到找到泛函的最小值。

称为变分法的数学分支研究最小化(最大化,极值化)泛函的问题。此时需要学习一些变分学知识。让我们从解决一些涉及多个变量函数的简单最小化问题开始;这将为我们处理可以被认为是无限多个变量的函数的泛函做好准备。在查看解答之前,您应该自己尝试这些例子。

例1:关于最小化函数

示例 2:针对所有 ,最小化函数

示例 3:针对所有 ,在约束条件 下,最小化函数

解法 1:计算 的偏导数。这两个导数都必须等于零。这只有在 时才能发生。

解法 2:计算 对所有 的偏导数,其中 。这些导数都必须等于零。这只有在所有 时才能发生。

方案 3:计算关于 的偏导数,其中。这些导数必须都等于零。只有当对于时才会发生。已知值,因此我们发现

直观计算

[编辑 | 编辑源代码]

现在让我们考虑最小化泛函关于所有函数的问题,前提是受限于。我们将首先以一种更直观但近似的方式进行最小化,然后我们将看到变分法如何更优雅地处理同样的任务。

Let us imagine that we are trying to minimize the integral with respect to all functions using a digital computer. The first problem is that we cannot represent "all functions" on a computer because we can only store finitely many values in an array within the computer memory. So we split the time interval into a large number of discrete steps , where the step size is small; in other words, . We can describe the function by its values at the points , assuming that the function is a straight line between these points. The time moments will be kept fixed, and then the various values will correspond to various possible functions . (In this way we definitely will not describe all possible functions , but the class of functions we do describe is broad enough so that we get the correct results in the limit . Basically, any function can be sufficiently well approximated by one of these "piecewise-linear" functions when the step size is small enough.)

由于我们已经离散化了时间并减少了对分段线性函数的关注,所以我们有

在每个区间内。因此,我们可以将积分表示为有限和,

其中,为方便起见,我们定义了

At this point we can perform the minimization of quite easily. The functional is now a function of variables , i.e. , so the minimum is achieved at the values where the derivatives of with respect to each are zero. This problem is now quite similar to the Example 3 above, so the solution is . Now we recall that is the value of the unknown function at the point . Therefore the minimum of the functional is found at the values such that would correspond to the function . As we increase the number of intervals, we still obtain the same function , therefore the same function is obtained in the limit . We conclude that the function minimizes the functional with the restrictions .

变分计算

[编辑 | 编辑源代码]

上述计算的优点在于更直观和视觉化:它清楚地表明,泛函关于函数的最小化,与函数关于大量变量的最小化非常相似,当变量数量无限增加时。然而,变分法的形式主义提供了一种更高效的计算程序。下面是如何计算使最小化的函数的方法。

让我们考虑函数的一个非常小的变化,并观察泛函如何变化。

(在许多教科书中,的变化用表示,通常任何量的变化用表示。为了清晰起见,我们选择用而不是来表示。)

泛函关于函数的变化的**变分**称为。变分本身是一个泛函,它依赖于两个函数:。当非常小时,我们期望变分在中是**线性**的,就像普通函数的值的变化在其自变量的变化量中是线性的,例如,对于小的。因此,我们期望泛函的变分将是的**线性泛函**。为了理解线性泛函是什么样的,考虑一个依赖于几个变量的线性函数。这个函数总是可以写成

其中 是合适的常数。由于泛函类似于无限多个变量的函数,索引 变成了连续变量,变量 和常数 变成了函数,而对 的求和变成了对 的积分。因此, 的线性泛函可以写成一个积分形式,

其中 是一个合适的函数。在通常函数 的情况下,“合适的常数” 是导数。根据类比,我们称上面的 为泛函的变分导数,并用 表示。

如果一个函数在某一点的导数为零,则该点为函数的极小值(或极大值,或极值点)。因此,泛函在函数处具有极小值(或极大值,或极值点),其中泛函导数为零。我们将在下面证明这个陈述,现在让我们计算泛函的泛函导数。

代入到泛函中,我们得到

其中我们将忽略的二次项,因此我们没有写出来。现在我们需要重写这个积分,使其不包含的导数;因此,我们进行分部积分,得到

由于在我们的例子中,值是固定的,函数必须满足,因此边界项消失。因此,变分导数为

泛函 在其在任意变化 下的变化为 的二阶量时,取得极值。然而,我们在上面已经得到该变化是一个一阶量,关于 线性;因此,对于 而言,该一阶量必须消失,其中泛函具有极值。诸如 这样的积分只有当函数 对所有 都消失时,才能对任意的 为零。在我们的例子中,“函数”,即变分导数,等于。因此,泛函 取得极值的函数 必须满足,或者更简单地说。该微分方程的一般解为,并且在附加限制 的情况下,我们立即得到解

一般公式

[编辑 | 编辑源代码]

概括来说:要求泛函 在函数 处取极值,会导致一个关于未知函数 的微分方程。这个微分方程可以表示为

这个过程与寻找函数 的极值非常相似,其中极值点 由方程确定。

假设现在要求我们最小化泛函,并且满足约束条件;在力学中,我们通常会处理这种类型的泛函。我们可以尝试像上面一样对函数进行离散化,但这很困难。此外,对于不同的泛函,一切都必须重新计算。与其一遍遍重复上述过程,不如现在推导出所有此类泛函的泛函导数公式,即

其中 是坐标 和速度 (假设有 个坐标,因此 )的给定函数。该函数 称为拉格朗日函数或简称拉格朗日量

我们将无穷小变化 引入函数 中,并首先通过 表示泛函的变化。

然后我们进行分部积分,舍弃边界项,得到

因此,变分导数可以写成

欧拉-拉格朗日方程

[编辑 | 编辑源代码]

再次考虑泛函在处取得极值的条件:一阶变分必须为零。我们已经推导出了上述变分的公式。由于所有都是完全任意的(仅受边界条件的限制),一阶变分仅当方括号内的函数在所有处都为零时才为零。因此,我们得到**欧拉-拉格朗日方程**

这些是表达以下数学要求的微分方程:泛函在函数集处取得极值。方程的数量与未知函数的数量相同,每个对应一个方程。

注意,欧拉-拉格朗日方程涉及拉格朗日量关于坐标和速度的偏导数。关于速度的导数有时写成,乍一看可能令人困惑。然而,这种记法的含义只是函数对其第二个参数的导数。

欧拉-拉格朗日方程还涉及关于时间的导数。这不是关于 的偏导数,而是全导数。换句话说,要计算,我们需要将函数 代入表达式,从而得到一个仅关于时间的函数,然后取该函数关于时间的导数。

注记:如果拉格朗日量包含高阶导数(例如二阶导数),则欧拉-拉格朗日公式会有所不同。例如,如果拉格朗日量为,则欧拉-拉格朗日方程为

请注意,该方程的时间导数最高可达四阶!通常,在经典力学的学习中不会遇到这种拉格朗日量,因为普通系统是由仅包含一阶导数的拉格朗日量来描述的。

总结:在力学中,人们通过编写拉格朗日量并指出其中的未知函数来指定一个系统。由此,人们使用欧拉-拉格朗日公式推导出运动方程。你需要非常了解这个公式,并理解如何应用它。这只有通过实践才能掌握。

如何选择拉格朗日量

[编辑 | 编辑源代码]

基本规则是拉格朗日量等于动能减去势能。(两者都应该在惯性参考系中测量!在非惯性系中,此规则可能会失效。)

可以证明,对于由点质量、弹簧、绳索、无摩擦导轨等组成的任意机械系统,无论如何引入广义坐标,此规则都适用。我们不会研究该陈述的证明,而是直接转向各种系统的拉格朗日量的示例。

拉格朗日量的例子

[编辑 | 编辑源代码]
  • 沿直线运动的自由质点,其坐标为的拉格朗日量为
  • 一个沿直线运动的质点,其坐标为 ,在一个势能为 的力场中。
  • 一个在三维空间中运动的质点,其坐标为 ,处于势能为 的力场中。
  • 一个点质量约束在圆上运动,该圆的方程为,在地球附近的引力场中(轴为竖直方向)。引入角度作为坐标较为方便,其中。则势能为,而动能为。因此拉格朗日量为

需要注意的是,我们在不知道维持质量沿圆周运动所需的力的前提下,写出了拉格朗日量(因此我们也可以推导出运动方程)。这展示了拉格朗日方法巨大的概念优势;在传统的牛顿方法中,第一步将是确定这个最初未知的力,这需要通过包含点质量未知加速度的方程组来求解。

  • 两个(相等)的点质量通过长度为的弹簧连接。
  • 一个数学摆,即一个无质量的刚性杆,长度为,其末端连接一个点质量,该摆只能在地球附近的引力场中(竖直轴)的平面上运动。我们选择杆与轴之间的角度作为坐标。拉格朗日量为

  • 一个质量为的质点,在没有摩擦力的斜面上滑动,斜面与水平面成角,处于地球的引力场中。我们选择作为坐标,其中平行于斜面。那么高度,因此势能为。动能计算如下:

因此,拉格朗日量为:

进一步工作

[编辑 | 编辑源代码]

练习:你现在应该确定从上述每个拉格朗日量推导出的欧拉-拉格朗日方程,并验证这些方程是否与从中学水平的牛顿力学考虑中获得的相应物理系统的方程相同。这最多应该占用你一两个小时的时间。只有这样,你才能开始理解拉格朗日方法的强大之处。

这里有一些关于拉格朗日的更多练习。

有关为机械系统建立拉格朗日量和推导欧拉-拉格朗日方程的更多示例,请咨询你的物理老师或查阅任何理论力学问题书籍。很多时候,某个复杂系统的欧拉-拉格朗日方程(例如,连接到另一个摆的端点上的摆)将难以求解,但关键是要获得推导它们的经验。在使用力的旧牛顿方法中,它们的推导将不那么直接。

有关微分方程的简要入门知识,请参见此处。

如果你第一次接触拉格朗日量,你可能仍然会问自己:为什么可以通过说某个积分具有最小值来描述系统的运动?这仅仅是一个纯粹的形式数学技巧吗?如果不是,如何才能获得更直观的理解?部分答案在这里

华夏公益教科书