在本科物理课程中教授狭义相对论需要相当的数学背景知识。特别重要的是向量和矩阵的操作以及对曲率的初步了解。本节末尾给出了数学背景,可以供不熟悉这些技术的人参考。
洛伦兹变换处理的是相对运动的观察者。一个观察者记录的事件坐标与另一个观察者记录的事件坐标之间是如何相关的?洛伦兹变换计算中使用的标准配置如下所示
推导出洛伦兹变换的方法有很多。通常的方法是从爱因斯坦的假设(物理定律在所有惯性参考系中都是相同的,光速是常数)开始,同时加上关于各向同性、线性和平移性的假设。另一种方法是从四维闵可夫斯基度量的假设开始。
在数学中,变换通常用“映射到”符号来表示
考虑一个自由运动的时钟。根据牛顿第一定律,物体在不受力的情况下将保持匀速直线运动;因此,时钟在任何给定方向上的速度 () 必须是一个常数。
如果时钟是一个真实的时钟,其读数由 给出,那么在任何其他惯性参考系中,相对于这些读数的经过时间变化率 () 将是一个常数。如果时钟相对于其他时钟以不均匀的速率滴答作响,那么宇宙在时间上就不是齐次的——在某些时候,时钟似乎会加速。这也意味着牛顿第一定律将被打破,宇宙在空间上就不是齐次的。
如果 和 是常数,那么 也是常数。这意味着时钟没有加速,即 .
线性体现在事物的长度与位置或相对位置无关;例如,如果,两点之间的距离将取决于观察者的位置,而如果关系是线性的(),则分离与位置无关。
线性性和齐次性假设意味着惯性系中物体的坐标与惯性系中的坐标之间的关系为
此公式称为庞加莱变换。它可以用指标符号表示为
如果两个参考系的原点重合,那么可以假设为零,方程
不熟悉此符号的人应注意,符号等表示,,和,因此上面的方程是以下内容的简写
使用矩阵表示法,可以将这组方程写成:
标准配置(见上图)具有几个特性,例如:
- 两个观察者坐标系的空間原点都位于运动线上,因此可以将 x 轴选为平行。
- 由 给出的点与 是相同的。
- 两个坐标系的原点可以重合,这样当它们彼此相邻时,时钟就可以同步。
- 坐标平面 ,y, y' 和 z,z' 可以排列成与运动方向正交(成直角)。
- 各向同性意味着在一个坐标系中 y=0 和 z=0 时正交的坐标平面,在另一个坐标系中 y'=0 和 z'=0 时也是正交的。
根据相对性原理,任何两个相同惯性参考系之间的变换都必须相同。这被称为互易定理。
从线性假设出发,考虑到原点 ,因此没有常数偏移,那么 和 ,因此 K=1。所以
以及,通过相同的推理
现在,考虑到事件的 x 坐标,可以假设 z 轴和 y 轴为 0(即:坐标的任意偏移,允许事件位于 x 轴上)。如果这样做,那么线性考虑和 和 是同一点,可以得出
(1)
其中 是一个常数。根据互易定理,我们也有
(2)
现在可以引入爱因斯坦关于光速恒定的假设,使得 ,也使得 。所以
以及
所以
以及
因此,洛伦兹变换方程为
时间坐标的变换可以从 x 坐标的变换推导出,假设 以及 ,或者直接从方程式 (1) 和 (2) 中通过类似的替换获得 。
洛伦兹变换的系数可以用矩阵形式表示
这种由于运动引起的坐标变换被称为boost。
洛伦兹变换方程可以用来证明
尽管在推导出洛伦兹变换时,线性、各向同性及均匀性假设是否从一开始就假设了这个恒等式,是一个有争议的问题。
鉴于: 也等于 ,以及其他一系列连续的变换,我们可以清楚地看到
量 被称为时空间隔,量 被称为位移平方。
对于所有观察者而言,给定的位移平方都是恒定的,无论他们以多快的速度运动,它被称为不变。
方程
被称为时空的度量。
我们已经了解到长度和持续时间对于移动的观察者看起来是不同的
- 长度在同时测量时,会缩短 γ 倍。
- 持续时间在同一地点测量时,会缩短 γ 倍。
我们可以扩展这些结果,以允许在不同时间和地点进行测量。
让我们考虑两个观察者 O 和 O',O' 相对于 O 沿 x 轴以速度 v 运动。我们将使用带撇号的变量来表示 O' 进行的所有测量。
目前我们可以假设这两个观察者具有相同的原点和 x 轴,因为我们已经知道如何允许观察者相对旋转和平移。稍后我们可以将这些复杂情况放回。
现在,任何长度或持续时间都可以写成两个坐标之间的差值,即物体两端或事件开始和结束的坐标差值,因此只需知道如何将坐标从一个坐标系转换为另一个坐标系就足够了。
我们知道如何在经典物理学中做到这一点,
我们需要将其扩展到相对论。
请注意,在经典物理学中,这种关系是线性的;这些方程的图像为直线。这使得数学运算变得简单得多,因此我们将尝试在相对论中找到坐标之间的线性关系,即一般形式为
其中 m、n、p 和 q 均与坐标无关。
首先,我们知道
- 当 t=0 时,x′ = γx(洛伦兹收缩)
- 当 x=0 时,t′ = γt(时间膨胀)
并且 O' 以速度 v 运动。他们测量自己的位置为 x′=0,但 O 测量的位置为 vt,因此我们必须有
- 当 x-vt=0 时,x′=0
x 和 x′ 之间唯一满足这些条件的关系为
这两个观察者必须测量光速相同,
或者,代入并整理,
满足这些条件的唯一t和t′之间的线性关系是
因此,带撇号和不带撇号的坐标通过以下关系式关联
这些方程被称为洛伦兹变换。
如果我们用ct而不是t来写,它们看起来会更简单。
以这种方式写出来,它们看起来很像描述三维空间中旋转的方程。事实上,一旦我们允许不同的勾股定理,它们就与旋转方程**完全相同**。
- 如果观察者彼此相对运动,它们的坐标系将在(x,ct)平面上旋转。
以下文字取自“维基教科书”讲座。
洛伦兹变换 可以仅从第一个假设推导出,无需任何其他假设。
洛伦兹变换描述了当一个观察者O2在一个不同的惯性系中看到一个向量时,一个观察者O1看到的时空中的向量变化的方式。
狭义相对论的假设指出,物理定律与观察者的速度无关。这等效于要求物理定律的数学表述必须在使用洛伦兹变换改变空间和时间的坐标时保持不变。
这就是洛伦兹变换是狭义相对论中的核心概念的原因。
四维向量是指在进行洛伦兹变换后,表现得像来自时空的向量的向量。找到对应于非相对论定律的相对论定律的标准方法是找到四维向量来代替空间向量。令人惊讶的是,这种简单的方法经常会成功。
为了简单起见,这里选择了空间坐标,使得x轴指向O2相对于O1运动的方向,而y和z坐标没有考虑在内。
这里介绍了一种确定矩阵 的方法,该矩阵将坐标从O1变换到O2,其中v是O2相对于O1的速度。
一般来说,这个矩阵看起来像 并将 转换到 通过.
这个矩阵的第一个要求是 O2 将在其自身的坐标系中静止(在空间中)。
因此,对于任何时间 t,.
这给了我们 和.
从 O2 到 O1 的反向转换由逆矩阵(其中 是从 O2 看 O1 的速度)必须使 O1 在其自身的坐标系中静止。
假设 (严格来说需要证明) 我们有 对于任何时间 ,导致 .
系数是v的函数。对于所有v,变换都是可逆的,所以 .
对于v=0,L(v)是单位矩阵,因此b(0)=0。这允许我们重写 ,其中 是一个未知函数。
现在 .
现在对于每一个,存在一个速度,使得。利用我们已经证明的内容,得到
比较对角线元素,我们立刻可以发现对于 的任意值,因此。
利用这个,我们可以重写 和 ,分别比较索引为 *(1,1)* 和 *(2,1)* 的元素。将 代入得到
由此可得 .
将此代入第一个方程,得到 .
当 时,上式简化为 ,因为 是单位矩阵。
令 为偶函数, 为奇函数,使得 .
这给了我们 。取对数并简化得到 ,由此我们得到 ,其中任何奇函数 。负号被 排除。
将 代入方程 (1) 验证了该解,但留下了 。
为了证明 ,我们在基础系统和变换系统中都翻转 x 轴方向。轴方向的选择不应导致不同的结果。在翻转的坐标系中,洛伦兹变换的形式为 ,对于 。
另一方面,我们可以通过对 使用坐标变换来计算 。
,由此可得,因此。结合,可得。
观察L(v)的特征向量,我们可以看到它们是,与v无关。
这等同于一个变换不变的速度,实验表明它等于光速。总的来说,我们有
注意,对于,我们将得到伽利略情况,没有有限的不变速度。
值得注意的是,如果我们不是在(t, x)的时空平面上进行同样的推导,而是在(x, y)的空间平面上进行,用斜率m=y/x代替速度v=x/t,除了通过计算之外,只通过实验就能发现,而L(m)只是在欧几里得空间中的一个旋转,没有实值的特征向量。
将此结果与之前提到的互易性、齐性和平移不变性假设进行比较是一个有趣的练习。洛伦兹变换矩阵形式中包含的线性方程是否从一开始就假设了一个特定的时空?
此外,重要的是要提到,行列式,与速度无关。这直接意味着时空体积是守恒的。
狭义相对论使用一个“平坦”的四维闵可夫斯基空间,它是时空的一个例子。然而,这个空间与标准的三维欧几里得空间非常相似,而且幸运的是,因此非常容易处理。
笛卡尔三维空间中的距离微分 (ds) 定义为
其中 是三个空间维度的微分。在狭义相对论的几何学中,添加了第四维时间,单位为 c,因此距离微分的方程变为
在许多情况下,将时间视为虚数可能很方便(例如,它可以简化方程),在这种情况下,上面的方程中的 被替换为 ,度量变为
注意,在这种情况下,ds 是距离,而不是间隔。在使用“虚数”时间时应谨慎,它不是现代相对论的一部分。Blandford 和 Thorne (2004) 在他们的“经典物理学应用”(http://www.pma.caltech.edu/Courses/ph136/yr2004/ ) 中,关于虚数时间写道:“(i) 它隐藏了 Minkowski 时空的真实物理几何形状,(ii) 它不能以任何合理的方式扩展到平坦时空中非正交基,以及 (iii) 它不能以任何合理的方式扩展到广义相对论中必须使用的曲线坐标。”
如果我们将空间维度降至 2,以便我们可以在 3D 空间中表示物理学
我们看到,诸如以光速运动的光之类的物体沿着双锥
由方程定义
或者
这是半径为 的圆的方程。以光速运动的物体的路径被称为**零测地线**。如果我们将上述方程扩展到三个空间维度,则零测地线是半径 = 距离 = c×(±时间) 的连续同心球。
这个零对偶锥代表了空间中一个点的“视线”。也就是说,当我们看向星星并说“我正在接收的来自那颗星星的光线是 X 年前的”,我们就是沿着这条视线在看:一条零测地线。我们正在看一个距离我们 米的事件,并且发生在 d/c 秒之前。 因此,零对偶锥也被称为“光锥”。(下图左下角的点代表恒星,原点代表观察者,线代表零测地线“视线”。)
-t区域中的锥体是该点“接收”的信息,而+t区域中的锥体是该点“发送”的信息。
考虑两个处于标准配置的惯性系。在第二个惯性系中有一个以 v m/s 的速度运动的刚性杆。杆的长度由同时观察杆端点的位置来确定 - 如果杆在运动,使用任何其他长度测量方法都是没有意义的。与杆以相同速度运动的观察者测量其“静止长度”。沿 x 轴的坐标的洛伦兹变换为
假设杆两端的坐标,,是同时确定的(即: 是常数)
或者,使用 表示杆的静止长度, 表示看到杆以 v m/s 的速度飞过的观察者测量的杆的长度
或者,详细说明
换句话说,以速度 运动的物体的长度在运动方向上收缩了一个因子 。
洛伦兹变换也影响着时钟读数的变化速率。时间的洛伦兹变换为
这个变换有两个组成部分
并且是直线图(例如:)。
图的斜率为 所以
或者
因此,如果是静止参考系中的时间间隔,是运动参考系中的时间间隔,则运动参考系中的时钟看起来会变慢。
或者,展开
图的截距是
这意味着如果在点处的时钟与在原点之间同步的时钟进行比较,它将显示秒的恒定时间差。这个量被称为相对论相位差或“相位”。
相对论相位与长度收缩和时间膨胀的结果一样重要。它是沿着运动方向同步于原点的时钟随着距离而不同步的量。相位影响除同步时钟的点以及经过该点的无穷小 y 和 z 平面上的所有时钟。其他所有地方的时钟在两个参考系之间将不同步。下图显示了相位的影响
如果每个惯性参考系由分布在空间中的时钟阵列组成,那么这些时钟将不同步,如上图所示。
有趣的是,当考虑时间差时,相位项是如何抵消的。它抵消是因为相位项应用于在带撇参考系中处于恒定位置的时钟。时间的洛伦兹变换是
两个时间之间的差异是
需要注意的是,时钟在其自身参考系中处于相同位置 。
结果是
其中相位项已抵消。
在狭义相对论的平坦时空
仅考虑x轴
双曲线的标准方程为
在时空的情况下
时空间隔将时空中的一个位置或事件与另一个位置或事件分开。因此,对于给定从一个位置到另一个位置的运动或给定参考系中的给定固定长度、给定时间间隔等,时空度量描述了一个双曲空间。这个双曲空间包含了所有观察者对给定间隔所做的所有观察的坐标。
可以像在欧几里得空间中一样想象双曲空间中的旋转。双曲空间中旋转的概念总结在下图中
双曲空间中的旋转等同于从一个参考系改变到另一个参考系,同时观察相同的时空间隔。它正在从给出以下内容的坐标移动
到给出以下内容的坐标
双曲空间中旋转的公式提供了洛伦兹变换的另一种形式,即
由此可得
的值可以通过考虑沿着 x 轴从原点以 运动的光的坐标来确定,该光在 秒内闪烁。
光上的观察者分配的坐标为:,静止观察者分配的坐标为 。下面是这些观测结果的双曲线图
双曲线的方程是
但是,对于闪烁的结束,x=vt,因此
现在,从双曲三角函数得到
但是 ,所以
并且,从双曲三角函数公式
将这些值代入双曲旋转方程
给出 x 的标准变换。
类似地, 等同于
因此,洛伦兹变换也可以从假设提升等同于具有度量 的双曲空间中的旋转中推导出。
双曲角 被称为提升的快度。
假设有三个观察者 1、2 和 3,它们沿 x 轴以不同的速度运动。观察者 1 和 2 以相对速度 运动,观察者 2 和 3 以相对速度 运动。问题是确定观察者 3 由观察者 1 观测到的速度 ()。
事实证明,快度之间存在一个非常方便的关系,可以解决这个问题。
如果 并且 ,那么
换句话说,快度可以简单地从一个观察者加到另一个观察者,即
因此
所以速度可以通过简单地添加快度来相加。使用双曲三角函数
因此
这就是相对论速度加法定理。
关系 如下所示
无需参考快度,就可以获得速度变换。速度在任意方向上的变换的一般情况如下所述:
其中 等是速度在 x、y、z 方向上的分量。
写出速度的分量
但从洛伦兹变换中可以看出
因此
将每个分数的分子和分母都除以
将代入
完整的速度变换如下表所示
|
|
|
|
|
|
计算完速度向量的分量后,现在可以计算帧间总体向量的幅度
在经典物理学中,速度简单地加起来。如果一个物体在一个参考系中以速度u运动,而这个参考系本身相对于第二个参考系以速度v运动,那么这个物体在第二个参考系中以速度u+v运动。
这与相对论不一致,因为它预测如果光速在第一个参考系中是c,那么它在第二个参考系中将是v+c。
我们需要找到一个组合速度的替代公式。我们可以用洛伦兹变换来做到这一点。
由于因子v/c将不断出现,我们将这个比率称为β。
我们正在考虑三个参考系:参考系O,参考系O'相对于参考系O以速度u运动,参考系O"相对于参考系O'以速度v运动。
我们想知道参考系O"相对于参考系O的速度,即U,在经典情况下应该是u+v。
从O到O'和O'到O"的变换可以写成矩阵方程,
其中我们定义了β和γ为
我们可以将这些组合起来,通过矩阵相乘得到O和O"坐标之间的关系,得到
这应该与两个参考系之间的洛伦兹变换相同,
这两个方程组看起来很相似。我们可以从(1)中的矩阵中提取出1+ββ'因子,使其看起来更相似
如果以下成立,这将与方程2相同
由于这两个方程*必须*给出相同的结果,我们知道这些条件必须为真。
将β写成速度方程3a中的形式
这告诉我们*U* 与*u* 和*v* 的关系。
一点代数运算表明,这意味着方程3b 也成立。
乘以*c*,我们最终可以写成:
注意,如果*u* 或*v*远小于*c*,则分母近似为1,速度近似相加;但如果*u* 或*v*为*c*,则*U*也是*c*,正如我们预期的。
本节正在开发中.
上面已经看到
并且,如果 以及,则速度加法定理可以表示为快度的和:
如果我们对该方程关于求导来研究加速度,然后假设为常数
所以
(1)
但 也等于
但是 ,反双曲正切函数的导数由下式给出:
因此:
为了简洁,我们将使用以下符号:
即: 是以相对速度 运动的观察者的伽马因子。
所以
(2)
无撇和有撇观察者观察到的物体的速度分别为:
以及
所以
并使用闵可夫斯基度量
所以
因此
给定 和
(3)
因此,将(2)和(3)代入(1)
如前所述,应用arctanh的微分来确定
这与牛顿公式不同,其中 。**固有加速度** 定义为物体在其静止系中的加速度。对于 和的观察者来说,它是速度的瞬时变化。在这种情况下
术语 称为“坐标加速度”。
在经典力学中,我们会谈论一个在x(t)处具有加速度d²x/dt²的粒子。在相对论中,我们必须将时间视为另一个坐标,并使用相对于固有时间的导数,这意味着我们的加速度概念将发生变化。我们可以假设粒子以低于光速的速度运动。
由于τ随着t单调递增(不允许时间旅行),因此我们可以轻松地用τ而不是t参数化粒子的路径。然后,相对于这两个变量的导数仅相差一个γ因子
这给了我们经典公式和相对论公式之间的联系。
假设我们有一个在路径 (x(τ),ct(τ)) 上运动的粒子,其中τ是粒子的固有时间。
它的四维速度向量是
在粒子的静止系中,它是 (0,c),具有恒定大小 -c2,但这个标量在所有参照系中必须相同,因此
也就是说,速度的大小始终是恒定的。
对它求微分,我们可以立即说
所以,速度和加速度始终是垂直的。
这两个结果比经典物理学中要简单得多。
对速度求微分,经过一些代数运算后,我们得到
当运动沿着x轴时。由于空间和时间分量必须分别是三维向量和标量,因此我们立即看到对于任意方向的运动,
它的大小是
它是经典量值,乘以一个与 γ 有关的修正因子。当速度远小于 c 时,此修正因子近似为 1,因此在该极限下,量值应与经典结果相同。
了解这一点后,我们可以计算出一个沿 x 轴以恒定加速度 a 运动的粒子的运动方程。为简单起见,我们假设初始速度为 0。
由于加速度是恒定的
积分一次,我们得到
或者,重新整理后得到
如果 at 远小于 c,则速度近似为 at,与经典结果相同,但随着 t 趋于无穷大,速度趋于 c。
位置为
其中 d 是一个常数。我们可以选择坐标系使 d 为零。
我们用 I 表示粒子与原点之间的间隔,则有
因此粒子与原点之间的间隔是恒定的。注意,这是一个双曲线方程,所以我们知道粒子的轨迹。
经典地,动量是速度乘以质量。我们可以在相对论中使用相同的定义,看看它会带我们到哪里。
你可能会看到这里出现的乘积 m0γ 被称为 相对论质量,但我们不会使用这种方法。
质量 m0 通常被称为 静止质量,以区别于相对论质量。
四动量的空间分量显然是经典动量,乘以一个 γ 因子。在远小于 c 的速度下,这将近似为 1。
时间分量是 m0γc。为了了解这意味着什么,我们可以看一下 v/c 很小时的值。
此展开式中的第一项是一个常数。
第二项是
这与我们所熟知的经典动能除以光速c的结果相同。
现在,在动能的定义中添加一个常数不会产生实际的影响,因为真正重要的是能量的变化,所以我们可以将相对论动量的这个时间分量识别为能量除以c。
然后我们有
即使静止,粒子也具有动能,
这是最著名的相对论方程。
在经典力学中,我们有
我们可以简单地通过用四维向量替换三维向量,用τ替换t,得到等效的相对论方程:
如果静止质量是恒定的,对于所有简单的系统都是这样,我们可以将其改写为
我们已经知道a,所以我们现在可以写成
这个时间分量本质上是功率,即能量随时间的变化率,这正如我们预期的那样,因为能量是动量的时间分量。
图:时空图显示一个以恒定加速度运动的参考系的原点的世界线。
我们知道这条世界线是一条双曲线,其渐近线为x=±ct。从图中我们可以看出另一个性质。
任何来自“暮色地带”的(x小于ct)光都无法到达加速的观察者。因此,暮色地带中的任何事件都不会影响观察者。
反之,存在一个区域,其中x小于-ct,加速观察者发出的任何光都无法到达该区域。因此,观察者无法影响该区域中的任何事件。
由于这种特性,我们将这两条渐近线称为事件视界。在某种程度上,它们就像时空中的单向屏障。加速观察者可以看见物体消失在事件视界后面,但他们永远看不到任何物体从事件视界中重新出现。
这些特定的事件视界是与观察者相关的,正如狭义相对论中所有事件视界一样。然而,广义相对论允许存在与观察者无关的事件视界。
我们不会证明这一点,但我们可以通过使用广义相对论的基本原理(爱因斯坦称之为等效原理)来了解事件视界如何在广义相对论中起作用:即引力只不过是一种惯性力。
这意味着引力在局部与由于加速度产生的力无法区分;如果电梯门关上了,我们就无法分辨我们是处于1g的引力场中静止,还是在零重力下以1g的加速度运动。
这表明我们可以通过研究加速参考系的特性来了解广义相对论。
现在,由于地球上的引力指向下方,因此我们站在地球表面时必须不断向上加速。这种对引力的解释的明显问题是我们似乎并没有远离地球中心,而这似乎是这种加速的自然结果。
然而,上一章的计算表明,即使与上述图中弯曲世界线相关的物体正在加速远离原点,它与原点的距离(在其自身框架中)始终保持不变。换句话说,即使我们正在加速远离地球中心,到地球中心的距离仍然是恒定的!
因此,由于等效原理,我们可以预期看到与狭义相对论中加速观察者相同的事物,包括一个事件视界。
在狭义相对论中的加速度情况下,惯性物体在无限时间内以c的速度穿过事件视界,相对于观察者而言。
类似地,在广义相对论中,自由落体物体在无限时间内以c的速度穿过事件视界,相对于静止的观察者而言。通过反转轨迹,我们可以得出结论,在事件视界处,逃逸速度为c,即引力非常强,光都无法逃逸。
因此,利用等效原理和狭义相对论中的加速度行为,我们预测了黑洞。
地球内部实际上不存在事件视界,因为地球的质量不是集中在一个点上,而地球只有在地球表面之外才能被视为一个点质量,而事件视界本来应该位于地球表面之内。
解释引力红移的时空图。
在引力场中,从较低水平发射的光在传播到较高水平时,其频率会降低。这种现象被称为引力红移。
我们可以利用等效原理来理解为什么会发生这种情况。处于引力场中相当于处于加速参考系中,因此了解多普勒频移在这种参考系中的工作方式将告诉我们它在引力场中的工作方式。
我们从非加速或惯性参考系观察光的发射和吸收过程,如图所示。在这个参考系中,光的观察者向右加速,如图中弯曲的红色世界线所示,这相当于向左的引力。
光在点 A 以频率 由一个此时静止的源发射。此时观察者在这个参考系中也是静止的。然而,当光到达观察者时,他们已经有了向右的速度,这意味着观察者测量的光的多普勒频移频率为 。由于观察者正在远离光源,,如上所示。
相对论多普勒频移由下式给出
因此我们需要计算U/c。观察者在点 B 的同时性线穿过原点,因此由线段 OB 给出。这条线的斜率为U/c,其中U 是观察者在点 B 的速度。从图中我们可以看到,这个斜率也可以用X' /X 的比率给出。
将这些等式相等,消去X,转而用L = √(X2 - X′2) 表示,这是观察者到原点的实际不变距离,并将此结果代入上式,得到我们的引力红移公式
如果X′ = 0,则不存在红移,因为光源与观察者共处。另一方面,如果光源位于原点,则X′=X,多普勒频移频率为零。此外,光永远不会到达观察者,因为世界线与穿过原点的光的世界线渐近。如果光源位于比观察者高的引力场水平,则X′ < 0,那么频率将转移到更高的值,即变为蓝移。
要了解这种多普勒频移与重力g 和光源与观察者之间距离h 的关系,首先要注意
进行这些替换得到
因此红移与重力成正比。
由于这种多普勒频移不依赖于波的类型,我们可以得出结论,它实际上是由时间膨胀引起的,就像由于相对运动引起的多普勒频移一样。
也就是说,重力减慢了时间。
在公式 1 中,gh 是引力势能的变化,因此频率的变化与势能的变化成正比,这表明可能存在与能量守恒的联系。
然而,由于我们还没有建立频率和能量之间的任何联系,我们不能简单地应用能量守恒论证。相反,我们可以反向论证,找出如果能量守恒,能量-频率关系必须是什么。
假设我们有两个相同的系统,它们都静止在均匀引力场g 中,初始能量为E,垂直距离为h。
该系统具有E/c2 的质量,赋予其势能,因此两个系统的总能量最初为
其中第二项是由于下部系统势能较低。
下部系统发射出一束频率为 ω 的波,能量为 E(ω)。当这束波到达上部系统时,频率已红移为 ω',能量为 E(ω')。该能量被上部系统吸收。
现在总能量为
为了保持能量守恒,这两个方程必须给出相同的结果。将它们等同起来,我们得到
将此与多普勒频移进行比较,我们发现
这只有在 E(ω) 与 ω 成正比时才成立
也就是说,能量守恒意味着 能量与频率成正比,这是量子理论的一个公理。
我们也可以从量子结果出发,证明引力红移必须存在。任何一个理论都需要另一个理论来保持一致性。
由于能量和频率都是四维矢量的时间分量,它们成正比意味着四维矢量本身及其空间分量也成正比。因此,对于波来说,动量与 k 成正比。
我们还记得,之前在分析哈密顿方程时,我们看到经典力学在几何光学极限下将等价于各向异性波的理论,如果能量与频率成正比,动量与波数成正比。这种正比关系不仅是能量守恒所必需的,而且可以使统一波粒二象性的理论成为可能。
这些都不能真正证明这种正比关系,需要实验才能证明,但它确实使这种假设成为一种自然假设,而实验也确实证实了这一点。
由于以上原因,从现在开始,我们将假设能量和频率以这种方式相关,比例常数为
引力红移也意味着空间是弯曲的。我们可以通过考虑时空中的矩形来观察这一点。
在没有引力的情况下,如果我们从某个点 A 开始,等待时间 t,然后以光速向右移动距离 h,我们将到达与我们以光速移动距离 h 然后相对于 A 停留时间 t 相同的位置 B。
在引力作用下,如果我们沿着第一条路径走,我们将上升距离 ct,然后等待时间 t。在第二条路径上,我们首先等待时间 t,但这会因引力而膨胀。对于 B 处的观察者来说,我们似乎等待了 t(1+gh/c2) 的时间才开始移动,因此我们最终比沿着第一条路径走的时间晚到达 B。
因此,在引力作用下,我们以何种顺序添加距离矢量是有区别的。如果空间是平坦的,这种情况不可能发生,因此空间必须是弯曲的。
为了描述空间的弯曲方式,我们需要使用广义相对论的技术。
在经典物理学中,我们知道运动学通常可以用势能来描述。现在我们已经看到,在相对论中,能量只是动量四维矢量的时间分量,因此我们应该期望势能也是如此。为了了解这一点,我们将从经典情况类比推理。
对于一个自由的、非相对论性的质量为 m 的粒子,总能量 E 等于动能 K,并且与粒子的动量 Π 有如下关系
在非相对论情况下,动量为 Π= mv,其中 v 是粒子速度。
如果粒子不是自由的,而是受到与势能 U(x,y,z) 相关的力的作用,那么必须修改该方程,以考虑 U 对总能量的贡献
作用在粒子上的力与势能的关系为
对于自由相对论粒子,我们有
将力添加到相对论情况下的明显方法是通过用势能改写此方程
然而 是一个四维向量,因此从该四维向量的单个分量中减去某个东西的方程不是相对论不变的。换句话说,该方程不遵守相对论原理,因此不能正确!
我们如何解决这个问题?一种方法是定义一个新的四维向量,其中U/c是其类时部分,而某个新的向量Q是其类空部分
然后我们从动量Π中减去Q。当我们这样做时,方程 (13.5) 变为
量Q称为势动量,Q为势四动量。
如果 |Π-Q|远小于mc,则它近似为
这种能量表达式与我们为经典速度相关力所考察的哈密顿量具有相同的形式,因此我们知道它预测了当条件满足时,力垂直于速度。事实证明,即使条件满足,它也是垂直的。
在经典物理学中,势动量是一个可选的额外部分。在相对论中,它是任何势场中不可或缺的一部分。
一些额外的术语很有用。我们定义
因为在经典情况下它简化为mv,所以我们将它称为动量。为了避免混淆,我们将Π 重新命名为总动量。因此,总动量等于动量加上势动量,类似于能量。
我们之前介绍了能量和动量守恒的概念。换句话说,如果我们有一组与宇宙其他部分隔离的粒子,每个粒子都有动量 pi 和能量 Ei,那么粒子可以被创建和销毁,它们可以相互碰撞。
在这些相互作用中,每个粒子的能量和动量可能会发生变化,但所有能量的总和以及所有动量的总和随时间保持不变。
用四动量表达更简单
在这一点上,像上面的这样的陈述应该引起警钟。在相对论的背景下,说总能量和动量随时间保持不变究竟意味着什么?哪个时间?哪个参考系的时间?
假设两个粒子在左图中粗水平线所示的时间内远程交换四动量。四动量守恒意味着
其中下标字母对应于图中的粒子标签。带撇号的值表示交换后的动量,而没有撇号表示交换前的值。
现在从右图中的参考系观察交换。在细水平线之间的区域存在四动量守恒问题。在这个区域,粒子 B 已经转移了它的四动量,但它还没有被粒子 A 接收到。换句话说,在这个参考系中,四动量不守恒!
这个问题非常严重,我们必须从物理学库中消除超距作用的概念。为了使粒子能够远程相互作用并且在所有参考系中仍然保持四动量守恒,唯一的方法是假设所有远程相互作用都是由另一个粒子或场介导的。
如果力是由一个粒子介导的,那么首先,粒子 A 以守恒四动量的方式发射粒子 C。其次,粒子 C 以同样守恒的相互作用被粒子 B 吸收。
如果力是由场介导的,那么首先,粒子 A 以守恒四动量的方式发射波 C,其动量与其波数成正比。然后,波 C 以c 或更小的速度传播,直到它以同样守恒的相互作用被粒子 B 吸收。
我们将看到,在量子理论中,粒子与场的区别消失了,因此这两种图实际上都描述了相同机制的不同视角。无论我们使用哪张图,四动量都在所有时间和所有参考系中都守恒。
换句话说,动量和能量从粒子 A 传递到粒子 B 是一个两步过程。动量在粒子或场之间传播。