认识论概要/为什么熵是真实的?
要了解物质的所有状态,熵是最基本和最重要的概念之一。有了它,我们几乎可以解释一切,没有它,几乎什么也解释不了。只要满足非常普遍的条件,熵就可以被分配到物质的各个片段,例如处于热平衡或接近热平衡,并且通常可以测量。从经验科学和热力学理论的角度来看,熵是一个真实的量,它描述了物质的真实属性。在热力学课程中,它被称为状态函数,意思是它是由系统的实际状态决定的。熵确实存在,不仅仅是理论家们的想象。
从统计物理学的角度来看,熵的真实性仍然是一个问题。
统计物理学要求我们区分物理系统的两种状态概念,微观状态,或微态,和宏观状态,或宏态。
- 宏态是由热力学定义的状态。它取决于宏观参数:体积,内能,摩尔数,压强,温度,表面张力,化学势,磁化强度,施加的外场或任何其他可测量的宏观参数,这些参数有助于确定所研究系统的平衡状态。
- 微态是系统的瞬时状态。它取决于所有微观成分的状态。在经典物理学中,它由所有组成粒子的位置和速度决定。在量子物理学中,微态是系统的量子态,由薛定谔方程决定。
宏态不进化,或者缓慢而通常确定性地进化,微态通常一直在变化,非常快,并且以随机的方式变化。
似乎系统的真实状态始终是它的微态。宏态只是一个粗略的描述,它忽略了所有的微观细节。
除了少数罕见的情况外,人们永远不会确切知道宏观系统的微态,因为人们必须知道所有微观成分的量子态,而这些成分数量太多,无法枚举,以及它们相互纠缠的方式。
由于微态通常是未知的,统计物理学对可能微态的概率分布进行推理。熵始终是从这个概率分布中定义的。它用吉布斯公式计算
其中 是所有可能微态 的概率。 是玻尔兹曼常数。
对于一个准孤立系统,可以证明在平衡状态下所有可能的微态都是等概率的(见补充)。以某种神秘的方式,这种概率分布被称为微正则系综。如果 是可能微态的数量。然后 等于 ,因为它们都相等。吉布斯公式然后导致玻尔兹曼公式
玻尔兹曼是第一个(1872-1875)定义统计熵的人。吉布斯后来对任何概率分布推广了玻尔兹曼公式(1902)。
在量子力学中,我们计算一个基底的微观态数量。这个数量就是所有可能的微观态空间的维数。当熵定义为一个概率分布时,我们可以为基底微观态分配概率,但最好用密度算符来推理。
熵衡量的是系统微观态信息的不确定性,因此是观察者无知程度的体现。但似乎它不是一个真实的量,因为它取决于观察者被告知的程度。我们是否应该得出这样的结论,即热力学错误地假设熵是一个状态函数?
统计物理通过对物理系统统计系综的推理,以数学上严谨的方式发展起来(吉布斯 1902)。微观态的概率被解释为统计系综中随机选取的系统处于该微观态的概率。
原则上,遍历性理论允许将用统计系综定义的量与用单个物理系统定义的量联系起来。系综平均被识别为系统时间平均。但我们通常考虑的是非常长时间的平均值,因为一个宏观系统需要花费与宇宙年龄相当的时间才能探索其可访问微观态空间的很大一部分。然而,热力学测量通常非常快。只要系统距离热平衡不太远,几分之一秒就足够了。我们甚至可以连续地测量它们。我们永远不会等待数十亿年。
如果用合适的统计集正确计算平衡量,结果就会得到观测结果的证实。但它的持续时间可能非常短,仅仅是系统达到平衡的时间。即使我们等待数小时,或者很少情况下数周,以使热力学平衡达到,但这不足以探索整个可访问微观态空间。那么,为什么用该空间上的概率分布计算的结果与观测结果相同呢?
民意调查原则可以解释实际上测量的热力学量与没有物理真实性的统计系综计算的量之间的相等。只要样本数量足够多且真正具有代表性,在代表性样本上计算的平均值就可以很好地近似于在整个集合上计算的平均值。在热力学测量中,系统只探索其可访问微观态空间的一小部分,但它可能足够大且具有代表性,以使测量的量与用统计集计算的量相同。
热力学测量类似于蒙特卡罗方法。为了评估平均值,我们从随机选择的样本中计算。理论家使用计算机的伪随机生成器来选择样本。实验者信任自然。它就像一个随机生成器,在每次观测时选择一个代表性样本,以证实我们的理论预测。蒙特卡罗方法比它所用来研究的统计系综更接近物理现实。当进行热力学测量时,自然本身在提供结果之前应用了蒙特卡罗方法。
简短的时间平均值是否代表所有可访问微观态空间,这在先验上并不明显,甚至相当排斥,因为我们只观察到系统轨迹的一小部分,它可能与其他部分截然不同。为什么自然是一个可靠的随机生成器,它能给我们提供真正代表性的长期平均样本?
与所有其他物理定律一样,热力学定律必须从量子物理学中得到证明,因为量子理论是最基本的物理学。然后人们可能会想知道,统计系综的概率是否可以解释为量子概率。退相干理论暗示了这一点。如果我们观察一个与我们没有观察到的环境相互作用的系统,我们必须用一个密度算符来描述它,该算符定义了系统状态上的概率分布。即使初始状态是精确确定的,后续演化也是由概率分布描述的。这种退相干效应可能非常快。但退相干获得的概率分布不是热力学统计系综的分布。退相干本身不足以解决短时间平均值的问题,但它可以帮助解决这个问题,因为它是一种非常快、非常强大且非常普遍的效应,它在物理系统的演化中引入了大量随机性。
统计物理学计算的概率分布(麦克斯韦-玻尔兹曼、费米-狄拉克、玻色-爱因斯坦)决定了热力学系统微观成分状态的概率。这些概率决定了气体中分子的速度,或者量子态占据数,使得可以定义微观熵,即每个分子或每个粒子量子态的熵。整个系统的熵是其成分的微观熵的总和,前提是它们是统计独立的(见补充)。为了考虑到粒子的不可区分性,必须考虑量子态占据数。
微观熵的真实性与观察的简短性并不冲突,因为微观成分的可访问状态空间很小。这足以证明微观熵的真实性,进而证明宏观熵的真实性。但为此,我们需要证明微观成分的统计独立性。
处于热力学平衡状态的系统的微观成分不可能完全独立。为了使它们独立,它们根本不应该相互作用。但如果它们不相互作用,它们就不能交换能量,热力学平衡就会被排除在外。
为了建立热力学平衡,假设成分以非常多样化的方式相互弱相互作用就足够了,即每个成分都与大量其他成分相互弱相互作用。例如,气体中的一个分子与所有其他分子弱耦合,因为它们会发生碰撞,但它是一种弱耦合,因为特定碰撞的概率非常小。
一个微观成分只能对其环境产生非常小的影响,因为它与环境相比非常小。如果这种影响进一步分散到许多其他部分,环境对其影响做出反应的可能性可以忽略不计。无论微观成分处于何种状态,环境在统计上几乎始终保持几乎相同。因此,成分的状态在统计上几乎独立于其环境的状态。由于这对所有微观成分都是正确的,所以它们彼此之间几乎都是独立的。可以得出结论,宏观熵是微观熵的总和。
为了证明统计熵的真实性,遍历性理论是不够的,最重要的是要证明微观成分的准统计独立性。
对热力学系统实际状态的信息缺乏不是来自观察者的懒惰或无能,而是来自观察现象的性质。热力学实验让观察到的系统达到或接近平衡。我们只控制少量宏观量,我们通过忽略微观态来让平衡稳定下来。如果我们试图更精确地了解它们,我们可能会阻止系统接近平衡,我们可能无法精确地观察我们想要观察的东西,即平衡或接近平衡。让系统在微观态空间中随机漫游是热力学平衡的必要条件。矛盾的是,对微观态的无知,这是观察者的一种主观属性,是发生热力学平衡的必要条件,这是一个真实的、客观的事件。这就是为什么熵测量信息缺乏,是一个客观的物质属性。正是信息缺乏使我们能够观察到热力学平衡。
麦克斯韦妖表明,信息可以转化为功。
考虑一个装有气体的容器。在容器中间放置一个隔板。隔板上有一个小门,由一个探测入射分子速度的装置控制。只有当来自左边的分子速度快于平均速度,或者来自右边的分子速度慢于平均速度时,门才会打开。这样,右边的隔室就会被加热,而左边的隔室就会被冷却(麦克斯韦 1871)。这种温差可以用来驱动热机。
这个开门装置就是一个麦克斯韦妖。它获取信息,这些信息可以转化为功。因此,信息是一种燃料。
麦克斯韦发明了他的“妖”来证明熵不减少定律只是一种统计规律,如果能够改变微观成分的统计平衡,就可以违背它。在麦克斯韦那个时代,原子和分子的存在还非常假设。因此,考虑操纵它们的可能性是不可能的。但是,一旦物质的微观成分被更好地认识,一个像麦克斯韦妖一样工作的机械装置的可能性就变得可以认真对待。
迄今为止,我们观察和操纵微观成分的能力还不足以实现麦克斯韦设想的装置,但扫描隧道显微镜使观察和操纵原子成为可能。因此,我们可以想象一种装置,它能够在降低观察系统熵的同时回收功,从而形成一种理论上可行的麦克斯韦妖。
考虑一个能够在其表面容纳原子的晶体。假设最初个原子随机分布在个位置上,并且温度足够低,使它们停留在那里。因此,它是一种冻结的无序状态。我们首先观察表面原子的精确构型,这可以通过扫描隧道显微镜来实现,然后我们用相同的显微镜将它们移动并收集在表面的一部分上。显微镜的活动类似于对气体的等温压缩功,只是它不是气体,而是表面上的冻结无序。
最初,可能的构型数量等于在个位置上放置个原子的方法数。因此,表面上原子冻结的无序状态对晶体的热力学熵贡献了。
我们使用了斯特林近似:
在对所有原子进行排序后。
因此,熵不减少定律似乎被违反了,正如麦克斯韦预测的那样,因为我们可以操纵原子。
原则上,原子的位移不需要任何功,因为撕裂原子的功可以在重新沉积时回收。但是,由于扫描隧道显微镜消耗能量并散发出热量,它不会减少总的热力学熵。将在下面讨论这一异议。
信息量和功
[edit | edit source]为了将晶体热力学熵的减少转化为功,我们将晶体的表面与一个体积为 的空容器接触,该容器的其它壁不能容纳原子。这个容器用一个可移动的隔板分成左右两部分,其体积分别为 和 。将晶体加热至使体积为 中的原子汽化。然后允许生成的氣体在整个容器中进行等温弛豫,从而提供功 。然后冷却晶体,使原子重新沉积在晶体表面。如果以一系列热浴进行可逆过程,则每个热浴在加热过程中提供的热量恰好等于它在冷却过程中回收的热量,因为气体的恒容比热不依赖于它的体积。晶体和用于加热它的热浴已经恢复到初始状态。
假设一个吸收壁可以在任意大的体积中制造完美的真空。这样的壁不可能存在,否则就可以制造出第二类永动机:将充满原子的壁与一个空容器接触,将其加热到足够高的温度使所有原子汽化。然后允许气体等温弛豫以提供功。然后将气体冷却到足够低的温度,使所有原子重新沉积在吸收壁上。如果进行可逆过程,则每个热浴在加热过程中提供的热量恰好等于它在冷却过程中回收的热量。因此,我们可以在从单个热浴中提取热量后,通过提供功返回到初始状态。
为了进行与热力学定律相符的精确计算,必须考虑到与吸收壁接触的气体的平衡密度。这个密度不可能为零,但它可以很小,原则上只要壁的吸收性足够强,它就可以像我们想要的那样小。这足以证明上面忽略了这个密度的计算。
假设 。因此
如果此外 ,我们得到
现在 等于观察所有表面原子位置时获得的信息熵的减少。因此,获得了以下定理的一个例子
如果信息熵小于热力学熵,那么两者之差乘以温度 度量了系统在只能从温度为 的热浴中获取热量时所能提供的功的最大值。
这个定理最早是由 Szilard 在 1929 年提出的。但他的模型很不现实,因为它假设单个分子可以像普通气体一样推动活塞。
麦克斯韦妖为什么不能降低总熵?
[edit | edit source]为了使麦克斯韦妖的存在与热力学定律相一致,至少必须满足以下条件之一
- 该装置的操作不会降低被观察系统的熵,因为它在降低熵之前会先增加熵。
- 该装置的操作会增加环境的熵。
- 该装置的操作会增加它自身的熵。
麦克斯韦认为他的妖必须看到分子。但是,为了看到它们,必须点燃气体并因此加热它。这种加热会增加气体的熵,人们可以预期这种增加将大于由温度差建立引起的减少。在这种情况下,条件 1 会阻止总熵的降低。
隧道显微镜不需要光,实际上可以降低被观测系统的熵。但它会消耗能量并向环境释放热量。人们倾向于认为,获取微观信息会阻止麦克斯韦妖减少总熵,因为它有能量消耗。但获取信息并不一定有能量消耗。如果由探测器和被观测系统组成的完整系统与其环境完全隔离,这并不会阻止探测器获取信息。例如,在理想的量子测量过程中,整个系统是隔离的。如果被观测系统处于测量特征态,如果有 n 个这样的可能初始态,那么探测器也有 n 个可能的最终态,并且被观测系统不会受到干扰。最初,完整系统的初始态有 n 种可能性,因为探测器处于单个微观态。最后,完整系统的最终态也有 n 种可能性,因为被观测系统和探测器完全相关。因此,信息获取不会增加完整系统的熵。
物理学并不禁止存在能够在没有能量消耗的情况下检测原子的系统。
我们是否应该得出结论,麦克斯韦妖可以减少总熵?
一台可以在不提供能量的情况下提升重量或移动汽车的机器可以制造第一类永动机。能量守恒定律,即热力学第一定律,禁止这种机器的存在。这是物理学最基本的定律之一。如果我们可以发明这种机器,所有物理学家都会错了,但没有人发明过它。
第二类永动机不违背能量守恒定律。任何物体都可以释放能量,前提是它被冷却,除非它处于零温度,即 0 开尔文 = -273.15 摄氏度 = -459.67 华氏度。因此,我们可以想象一辆汽车、一艘船或一架飞机可以在不消耗燃料的情况下前进。它只需要吸收室温下的空气或水,并将它们排放到更低的温度。能量的差异将被用来驱动发动机。
为了使这种发动机工作,必须能够将一个温度均匀的系统分离成两部分,一部分更热,另一部分更冷。但根据热力学第二定律,这是不允许的,因为它会导致总熵减少。因此,第二类永动机不可能实现,这是由于总熵不减定律,即热力学第二定律。
是几乎隔离系统的全部可达状态,即环境的扰动不会改变系统的能量。 是从状态 到状态 的每单位时间的跃迁概率。假设所有微观演化都是可逆的。
对于所有 和所有 .
是在时间 状态 的概率。根据 的定义,我们有
因为
那么
但是
所以
和 符号相同,并且 始终为正,因此
矛盾的是,微观可逆性假设,,导致宏观过程不可逆定律,因为准孤立系统的熵永远不会减少。
微正则系综是一个平衡分布
因为对于所有的 和所有的 ,。
这是唯一的平衡分布,因为如果 不全相等,至少存在一个 小于其他值。在所有满足 的状态 中,至少存在一个满足 的状态,其中 满足 ,否则它们将不可访问。那么
该分布不处于平衡状态。
对于一个没有实际存在的统计系综,熵不减定理以数学严谨的方式得到证明。 定义了时刻 状态 的占据概率,对于理论家想象的巨大集合中的所有系统。它描述了这个巨大集合的演化,而不是真实物理系统的演化。但在非常一般的条件下,可以将 解释为可测量的真实概率,并因此将它们的演化与观测到的量进行比较。
假设系统的宏观演化速度比微观波动慢。那么,每个微观组分的环境在足够长的时间内几乎是恒定的,足以让它探索它的状态空间,从而定义这些状态的占据概率。对于每个微观组分 ,因此可以定义占据状态 的概率 ,原则上可以测量它们。假设所有微观组分在统计上是独立的,这些 足以定义宏观系统所有状态 的概率 。
在液态-玻璃转变过程中,液体和冷却它的热浴的可达熵总量下降。玻璃的可达熵下降并没有被热浴的可达熵增加所抵消。因此,似乎可达熵增加定理被违反了,而它在非常一般的条件下得到了严格的证明。但是,当玻璃以无序的结构冻结时,其他结构在理论上仍然是可以达到的。热浴短暂地放弃一些热量,使玻璃再次成为液体,然后以另一种无序的结构再次成为玻璃的概率很小但非零。因此,原则上所有结构始终都是可达的,但在实践中,玻璃保持冻结在一个结构中。可达熵增加定理认为,可达状态空间没有改变。它忽略了微观状态在实践中变得不可达的可能性。
当各个部分相互独立时,一个总体的熵等于各个部分熵的总和。
设 和 是系统 的两个独立部分。 和 分别是 和 的可访问状态。
和 的熵为
的所有可访问状态都是所有 状态,对于所有 和所有 。如果 和 是独立的,那么 的概率是 ,而 的熵是
齐拉德引擎
[edit | edit source]为了更好地理解信息转化为功的过程,齐拉德(1929)邀请我们思考一个用“单分子气体”工作的引擎。
一个分子被封闭在一个可以被可移动壁隔开的容器中。当壁被放置在容器的中间时,就可以检测到分子在两个独立隔室中的存在。因此,获得了 1 位的信息。然后,该壁用作一个活塞,分子可以在上面做功。需要知道分子的位置才能知道活塞移动的方向才能回收功。这样,人们计算出在最佳条件下,用 1 位信息就可以回收 的功。这是分子在温度为 的等温膨胀过程中对活塞做的功,该功使可访问体积翻倍。
Szilard 引擎似乎与热力学相矛盾,因为它暗示我们可以制造第二类永动机。如果活塞只能在一个方向上移动,那么就没有必要知道分子的位置来恢复功。活塞有一半时间保持静止,因为分子位于活塞的错误一侧,我们无法恢复任何功,但有一半时间它会移动,我们会恢复等于 的功。通过多次重复实验,我们可以获得任意数量的功,而无需花费任何能量来了解分子的位置。
但是,这样的过程需要一个设备来移除活塞并将其放回原位。现在,在一个循环结束时,活塞可能有两个位置,要么在中间(如果它没有移动),要么在一端(如果它已移动)。因此,该设备必须在每个循环结束时获取一些信息。为了回到其初始状态,它必须擦除这些信息。因此,擦除信息的成本也出现在第二类永动机不可能的根本原因中(Leff & Rex 1990)。
Szilard 引擎证实了可达性熵可能不同于热力学熵:当我们在单分子气体的中间引入一个壁时,可达性熵的减少是 。另一方面,热力学熵不会减少,因为气体没有产生热量。对于 Szilard 引擎,可达性熵原则上可以减少任意数量。我们只需要在容器内部放置多个壁。
为什么宇宙的熵会增加?
[edit | edit source]熵增加定律表明,宇宙的熵只能增加,它从一个低熵宏观状态开始,温度很高但非常稠密,并且它的膨胀使它冷却下来,同时增加了它的熵。但是,这种说法面临着两个难题。
- 由于宇宙是完全孤立的,它的熵(如果我们可以定义它)应该守恒。
- 谈论宇宙的宏观状态实际上并没有意义,因为谈论它可能存在的微观状态的空间毫无意义。它处于一个单一的微观状态,有时被称为宇宙的波函数。
但是,仍然有意义地说宇宙的熵在增加。我们可以为它的各个部分(恒星、行星、黑洞、星际介质……)分配熵,并发现所有这些熵的总和都在增加。但是,当我们这样做时,我们假设各个部分在统计上是独立的,我们忽略了它们之间的相关性。对相关性的无知会导致高估总熵。如果我们知道宇宙的微观状态,我们也会知道其各个部分之间的所有相关性,并且我们会注意到总熵不会增加。它将始终保持为零。但是,显然不可能知道宇宙的微观状态。
参考文献
[edit | edit source]Bennett, Charles H., The thermodynamics of computation - a review (Int. J. Theor. Phys. 21, 905-40, 1982, reproduced in Leff & Rex 1990)
Diu, Bernard, Guthmann, Claudine, Lederer, Danielle, Roulet, Bernard, Éléments de physique statistique (1989)
Feynman, Richard P., Lectures on computation (1996)
Landauer, Rolf W., Irreversibility and heat generation in the computing process (IBM J. Res. Dev. 5, 183-91, 1961, reproduced in Leff & Rex 1990)
Leff, Harvey S., Rex, Andrew F., Maxwell's demon, entropy, information, computing (1990)
Maxwell, James Clerk, Theory of heat (1871)
Sethna, James P., Statistical mechanics : entropy, order parameters and complexity (2018)
Szilard, Leo, On the decrease of entropy in a thermodynamic system by the intervention of intelligent beings (Zeitschrift für Physik, 1929, 53, 840-856, translated in Leff & Rex 1990)