熵初学者指南
在热力学教科书中,状态函数“熵”可以从第一性原理出发,使热力学的研究变得容易。
在本讨论中,我们将仔细研究熵的定义和热力学第二定律。在经典热力学中,熵的引入方式如下:对于任何物理系统,都存在一个称为“熵”的状态函数S。对于均质封闭系统,在系统温度为T时,少量热量供应δQ后,熵会按照以下公式增加:
- ...............................(1)
需要注意的是,δQ 是一个不精确的微分。熵是一个状态函数,dS 是一个精确的微分。对于非均质系统,熵是各个子系统熵的总和。
在这里,我们将遵循统计热力学的方法。它涉及波动力学,被称为玻尔兹曼的统计方法。在接下来的几段中,我们将介绍熵,几乎不涉及数学。我们将证明这个定义与上面给出的经典定义一致,并建立与热力学后续章节的联系。
本介绍从讨论“量子态”开始。
诸如温度、压强、体积、物质含量等函数,表征了物理系统的“状态”。对于所有常见的实验,这些“状态函数”的值在平衡状态下保持不变,尽管在原子尺度上,情况却在不断变化。例如,在气体中,原子每次碰撞后,都会产生一个新的状态,而温度、压强或体积却不会发生变化,从而产生一系列不同的“状态”。为了便于讨论,我们将这些设想原子运动的状态称为“微观状态”,并将上面提到的状态称为“宏观状态”,用温度、体积、压强等定义。
按照经典力学的思路,气体中微观状态的数量是不确定的:比如,在一个箱子里,任何一个原子沿着x坐标轴从x0移动到xE,都可能有速度v。这个v可以取无限多个值,同样地,在一个特定的时刻,原子的位置也可以在x0到xE之间取任意值。因此,在经典力学中,运动的原子可能处于不确定的“微观状态”数量中。
然而,在20世纪初,随着量子物理学的兴起,这种对力学的看法似乎过于简单。得出的结论是,任何物理系统中的微观状态数量都是确定的,这个数字可能很大,非常大,但不是无限的。
在这个新理论中,离散的微观状态被称为“量子态”。
量子这个词来源于马克斯·普朗克对光性质的结论。在19世纪,光的波动理论被普遍接受,因为它可以解释“所有”实验事实。然而,在1900年,普朗克在研究“黑体”发出的辐射以及该辐射的频率分布时,发现了与波动理论不相容的实验事实。他被迫得出结论,黑体辐射的能量是以离散的量存在的,“波包”(“量子”)。不仅是黑体辐射,所有的光和其他电磁辐射似乎都由这样的波包组成,既是粒子又是波。
这种观点引发了一系列思考;从1900年到1930年,一套全新的物理学被发展起来。
作为微型台球的经典原子概念似乎站不住脚;原子在许多方面表现出类似于光量子的波包的特征。
在基于经典(牛顿)力学的老物理学中,可以观察任何物体的大小、重量和其他性质。它的运动是与这些性质完全独立的概念。
相反,波的存在离不开运动;在量子力学中,粒子的存在和运动是同一事物的两个相互关联的方面。
显然,在经典力学成功应用了几个世纪之后,得出经典力学已经过时,必须用一种相当“荒谬”的力学类型来代替的结论,在科学界引起了质疑。幸运的是,量子力学和经典力学的结果在许多情况下似乎相互对应。特别是在常见比例的系统中,在正常温度下,两种理论的结果都一致。这个结论,将经典力学先前的结果完整地保留了下来,被称为“对应原理”。
在经典力学和波动力学的结果非常接近的情况下,可以自由选择两种理论中的任何一种应用于同一物体,但在两种理论给出不同结果的情况下,应优先考虑量子力学。
作为例子,我们可以考虑最简单的例子,原子在一维空间中在两堵墙之间运动。图1可以看出,在这种情况下,两种观点之间的差异非常大。从经典力学的角度来看,原子在两堵墙之间上下运动,可以处于任何水平x,也可以具有任何速度v,因此不同“状态”的数量是无限的。另一方面,量子力学处理的只是驻波,因此可能状态的数量是确定的,中间状态是不可能的。
图1。原子在一维空间中自由移动,分别从经典力学和波动力学的角度考虑。
两幅图都代表了对原子在两堵墙之间一维空间中运动的视觉理解。在经典力学中,原子被表示为微型台球,而在波动力学中,相同的原子被表示为驻波。在第二种情况下,“状态”的数量是确定的,而在第一种情况下则不是。
因此,为了研究微观状态,我们必须求助于量子力学。在本例中,提到的驻波的特点是波数n,它是一个非零的整数。每个波形都与它的特征能量耦合,与n2成正比。(在经典力学中,能量与v2成正比)
一维空间中一个粒子的驻波模式可能非常简单,一个三维空间中的粒子就有了更复杂的波形,可以用三个量子数来描述,例如,在x-y-z空间中,可以用数字nx、ny和nz来描述。当粒子在一个立方容器中运动时,这种三维波形与一个能量水平耦合,该能量水平与成正比。
显然,一个拥有多个粒子,并在三维空间中独立运动的系统,会表现出更加复杂的波形模式。当原子不再自由,而是像液体或晶体中那样相互接触时,会存在更加复杂的协同波模式,这种模式始终是清晰定义的。
量子态数量与熵
[edit | edit source]从数学角度来说,量子数n没有上限,但由于在实际系统中,能量始终存在上限,量子数的大小同样也存在上限。
例如,假设量子数的上限为:n = 10,那么具有单维运动的可能波形模式数量也为十个。对于一个具有三维运动的粒子,波形模式数量将变为一千个,而对于在同一空间内的两个粒子,这个数量将变为一百万个。按照这种推理,对于一个具有N个粒子和三维运动的常见系统,可能的波形模式数量将变为:,这是一个非常大的数字,并且始终是清晰定义的。
对于在实验室和技术环境中使用的实际系统,这种计算并不简单:量子数的上限总是远大于10,而且粒子的数量(原子)通常很大,超过。
然而,计算是可行的:早在1916年,萨库尔和泰特罗德就提出了一种复杂的公式,用来计算理想气体中可用的量子态数量,假设所有原子都在一个明确定义的空间内独立运动(参见w:萨库尔-泰特罗德方程),这是一个重要的波动力学表达式。这个公式包含了相关的修正,其中最重要的修正是对系统中存在的相同原子和不同原子进行严格区分。当两个不同的原子交换位置时,会产生一个新的量子态,但当两个相同的原子交换位置时,就不会产生新的量子态。
(这种严格区分带来了“混合熵”现象,消除了经典热力学中存在的一个矛盾,称为“吉布斯佯谬”。)
使用萨库尔-泰特罗德公式进行计算的结果非常显著:例如,在1摩尔氩气中,温度为300 K,压强为1巴(接近“理想气体”),“可用”量子态的数量为
。这个数字非常大,但不是无穷大。
这种大小的数字超出了我们的理解能力,也很难用于任何计算。对于计算来说,取指数就足够了,它就是g的“对数”(公式:log(g)),然后乘以一个适当的小因子。在热力学中,这是一种常见的做法,为了方便起见,我们选择“自然对数”(ln(g)),它比提到的log(g)大约大2.3倍。
以这种方式“驯服”后的数字被称为“熵”,用符号S表示,公式如下
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (2)
提到的“适当”因子k始终是“玻尔兹曼常数”,大小为
J/K。
换句话说:熵是量子态数量的表示。根据公式(2),提到的1摩尔氩气在300 K和1巴下的熵可以计算为:Sargon = 155 J/(molK)
热力学第二定律
[edit | edit source]量子态数量在物理平衡的建立中起着重要的作用,例如一杯茶的冷却、飞轮旋转的衰减等等。这些量子态的数量在物理系统中非常庞大,导致同一系统的两个宏观态之间的任何差异通常都与这些数量的巨大差异相关联。
一个例子是一个具有两个不同温度部分的系统,它们自发地朝着相同温度运动。想象一个孤立的系统,有两个铜块,每个块为1摩尔,初始温度分别为299 K和301 K,然后运动到两个块都为300 K的状态。铜的摩尔热容为24.44 J/(molK)。
一个相对简单的计算表明,在这个过程中,熵增加了0.00027 J/K,虽然看起来增加很少,但这仍然很重要,因为它对应于量子态数量的巨大差异:这个过程的结果是数量增加了
能量保持不变,所有这些量子态具有相同的概率,系统将盲目地在两种类型的巨量量子态中漫游,最终(几乎)肯定会进入温度相等的宏观态的其中一个量子态,仅仅是由于数量上的巨大差异驱动。(参见图2中的“像素跳跃者”。)
图2。色盲像素跳跃者。
这幅图是由100 000个蓝色像素和100个红色像素组成的彩色区域构成。仔细观察,读者可以在红色区域中找到一个黑色像素。假设这是一个“像素跳跃者”,它停留在一个红色像素上,我们可以想象它通过从一个(彩色)像素跳到另一个像素来四处移动。所有像素的概率都相等,很明显,经过一段时间后,跳跃者在蓝色像素上被发现的概率是它在红色像素上被发现的概率的1000倍。这种从红色到蓝色的移动不能归因于一种神秘的偏好,这种偏好驱动色盲跳跃者走向蓝色,这种移动仅仅是由数量上的差异造成的。
在实际应用中,任何向熵更高的宏观态的转变都可能发生,而其逆过程的可能性如此之低,以至于我们无法期望观察到它,即使在数十亿年的时间里也不可能观察到。在热力学中,我们将后一种说法简化为:“这是不可能的”。
而且
孤立系统的熵不能减少。这个说法就是“热力学第二定律”。这个定律的一个推论是,只用一个热库将热量转化为功的永动机是不可能的,因为,提取热量会降低系统的熵,而产生的功不会引起熵的变化。另一个推论是,可逆变化不能改变熵,因为减少是不可能的,而熵的增加在反转后会转化为减少。
熵与能量平衡
[edit | edit source]从已经建立的经典热力学中借用“熵”这个词,并将其用于一个完全不同的概念,这似乎有些大胆。这样做需要有正当理由。
这种证明可以在将迄今为止考虑的孤立系统与经典热力学中考虑的非孤立系统进行比较中找到。
孤立系统的能量处于狭窄的范围内,从: 到 ,考虑到在热力学中 dE 不会像数学那样趋近于零,因为量子态的数量也会趋近于零。在热力学中,当 dE 足够小以至于所有分区内的量子态具有(几乎)相同的概率时,通常会谈论“孤立系统”。虽然不为零,但这种 dE 的量级也很小,小到无法通过量热法检测出来。
与热浴接触的非孤立系统存在着截然不同的情况:系统的能量一直在波动。概率 P 的钟形曲线(见图 3)可以被认为由许多宽度为 dE 焦耳的等效分区组成,而在孤立状态下只存在一个分区。因此,可用量子态的数量会大幅增加。在一个有 个原子的系统中,这些数字将增加一个超过 的因子,导致熵的小贡献绝对可以忽略不计。
这看起来像一个奇迹:在乘以一百万、十亿甚至一万亿后,这些大数字的对数在所有实际用途上都没有改变。这个奇迹意味着我们可以自由地谈论“熵”S,无论系统是否被隔离。
在图 3 中,可以看到系统的概率 P 是由钟形曲线来表征的,这是两个相反效应的结果:随着能量的增加,数量的增加和概率的减少。可以很容易地计算出来(见下面的验证),在数字平衡概率的 E=U 水平上,统计方法和经典方法一致,因此在平衡状态下,两种方法都导致相同的结果。
所以,像我们上面所做的那样,采用经典的名称“熵”来表示统计概念是正确的。
图 3。孤立系统和与热浴接触的系统比较。
在两幅图中,纵坐标都是系统处于能量级 E 的概率。左图显示了“孤立”系统的情况,P 为 1:系统始终处于能量级 U。右图显示了相同系统的状况,该系统与热浴处于平衡状态。由于热运动,其能量围绕平均值 U 波动。波动非常小,无法通过量热法检测出来,但在原子尺度上它们很重要。
两种相反的趋势,即量子态数量的增加和它们的概率随着能量的增加而减少,导致曲线开始上升,而它在高于 U 的能量处下降。
波动能量的一个有趣方面是钟形概率曲线内变化的可逆性。例如,当系统在图 3 中自发地从能量级 E1 移动到能量级 E2 时,可以确定,经过一段时间后,系统将自发地返回到 E1。可逆过程在热力学中起着重要作用,它们是此类可逆变化的链条。
验证
[edit | edit source]在本章中,我们将证明上面提到的一个重要陈述,即统计方法和经典方法导致相同的熵。
如上所述,经典熵和统计熵之间的一个区别是,后者是针对孤立系统定义的,而经典熵是基于其在向与热浴接触的非孤立系统供热后发生的变化来定义的。因此,我们必须比较非孤立系统和孤立系统,以追踪两种定义之间的最终一致性。与热浴接触时,系统的能量会不断波动,这是由于来自热浴原子和向热浴原子传递的脉冲造成的,见上面图 3。在图中,找到系统处于能量级 E 的概率称为 P,或者更确切地说:P·dE 是找到系统处于 E 和 E+dE 之间的间隔内的能量级的概率。这个间隔 dE 可以选择与我们上面称为“分区”的间隔具有相同的宽度,将整个函数划分为“分区”。
如上所述,两个相反的效应决定了概率 P,并导致其上升和下降。一方面,量子态的数量随着能量级的增加而增加,另一方面,这些量子态的概率根据所谓的玻尔兹曼因子而随着它们的能量而减少。
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (3)
这两种效应在顶点处完全相互抵消,此时 P-E 曲线水平通过。
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (4)
这个公式是比较统计熵和经典熵定义的关键,即从函数 P 的公式中,可以通过微分来计算商式 (4),从而得到经典公式 (1)
dS = dQ/T。
可以沿着以下思路进行此计算。作为起点,可以采用 E 和 E+dE 之间分区的概率公式。
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (5)
定义为 g·dE 近似于 E 和 E+dE 之间存在的量子态数。B 是玻尔兹曼因子,Z 是“配分函数”,是归一化因子,它对于使所有概率之和为 1 是必要的:
.
对 (5) 进行微分,得到
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (6)
当因子为零时,该表达式变为零: 为零。由于:,这意味着
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (7)
这种关系 (7) 的一个结果是,“熵单位”的量纲必须是:焦耳每开尔文,J/K。
此外,当热量可逆地供应给系统时,可以注意其含义。
热量供应
[edit | edit source]当 δQ 焦耳热量可逆地供应给系统时,δQ 超过一个分区,平均能量 U 将增加:dU = δQ。假设 dS/dE 在热量供应过程中保持恒定,我们从 (7) 推导出
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (8)
随后,由于 dU = δQ,得到
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (9)
这与经典公式 (1) 相同,结果是
统计熵与经典熵相同。
全微分
[edit | edit source]在定义熵之后,可以像往常一样执行正式的热力学及其应用,并考虑全微分的数学概念,这意味着多个变量的函数。
例如,当 z = f(x,y) 是两个独立变量 x 和 y 的单值函数时,该函数可以在直角坐标系中绘制,结果是一个曲面。热力学中所考虑的函数是,这个曲面始终是连续的,而且通常是稍微弯曲的。观察曲面上某个点 x,y 的运动,一小步移动可以是平行于 YZ 坐标平面的 dx,使函数 z 增加 dz,这是 x 方向的步长乘以相应的梯度
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (10)
这称为函数 z 的“偏微分”。当随后在 y 方向上迈出一步时,相应的增加会被添加,得到
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (11)
该组合公式是函数 z 的“全微分”。
当 dQ 焦耳热量和 dW 焦耳功供应给物理系统时,能量会增加
dU = dQ + dW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (12)
由于 Q 和 W 不是状态函数,(12) 不能与全微分比较: (11),但可以将两项代入以获得与状态函数 V 和 S 作为独立变量的关系,使其更接近 (11)。当考虑一个由体积为 V、压强为 P 的气体组成的系统时,我们可以计算出功为:dW=-PdV,而公式 (9) 意味着:dQ=TdS,并将两者代入 (12),结果是
dU = TdS – PdV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (13)
当满足两个条件时,这种关系 (13) 实际上将是函数 U(S,V) 的全微分,首先,在热量供应过程中应保持体积恒定,其次,在功供应过程中气体的熵必须保持恒定。第一个条件很容易满足,而第二个条件也可以同样满足,即例如当相关的功可逆地从旋转飞轮进入或退出时,气体加飞轮的熵在该变化过程中将保持恒定,因为气体加飞轮可以被认为是孤立的系统。因此,在状态改变过程中,气体的熵将保持恒定,满足成为全微分的条件。所以 (13) 也可以写成
. . . . . . . . . . . . . . . . . . . . . . . . . . (14)
由此可以得出结论
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (15)
以及
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (16)
需要指出的是,上述关于“无熵功”的表述并非定性的,而是定量的。量子力学要求任何旋转的质量、分子或轮子都带来其量子态,从而导致熵的贡献。这种贡献是可以计算的,结果表明,对于旋转的宏观物体,这种贡献似乎是绝对可以忽略不计的。
从关系式 (14)、(15) 和 (16) 出发,利用全微分的性质可以讨论卡诺循环、热泵、化学平衡以及所有其他相关的热力学主题,就像所有教科书中所做的那样。这样,本文的意图就达到了。