熵初学者
在热力学教科书中,状态函数‘熵’可以通过第一性原理来处理,使热力学研究很容易理解。
在本次讨论中,我们将仔细研究熵的定义和热力学第二定律。在经典热力学中,熵的引入如下:对于任何物理系统,存在一个称为“熵”的状态函数S。对于均匀的封闭系统,在系统温度为T时,经过少量热量供应δQ后,熵会增加,根据以下公式:
- ...............................(1)
注意,δQ 是一个不精确微分。熵是一个状态函数,dS 是一个精确微分。对于非均匀系统,熵是各个子系统熵的总和。
在这里,我们将遵循类似于统计热力学的方法。它涉及波动力学,被称为玻尔兹曼的统计方法。在接下来的段落中,我们将介绍熵,几乎没有数学。将证明,该定义与上述经典定义一致,并与热力学的后续章节建立了联系。
本介绍从讨论“量子态”开始。
诸如温度、压力、体积、物质含量等函数描述了物理系统的“状态”。对于所有常见的实验,这些“状态函数”的值在平衡状态下保持恒定,尽管在原子尺度上情况在不断变化。例如,在气体中,每次原子碰撞后,都会产生一种新的情况,而温度、压力或体积都不会改变,从而产生一系列不同的“状态”。为了进一步讨论,我们将把这些设想原子运动的状态称为“微观态”,并将“宏观态”应用于上述状态,用其温度、体积、压力等定义。
从经典力学的角度来看,气体中微观态的数量没有明确的定义:例如,一个盒子中的任何原子,沿x坐标从:x0 到 xE 移动,可以具有速度 v。这个 v 可以有无限多个值,同样,在某个特定时刻,原子的位置可以在:x0 到 xE 之间的任何地方。因此,在经典力学中,移动的原子可能处于无限多个可能的“微观态”。
然而,在 20 世纪初,随着量子物理学的兴起,这种对力学的看法似乎过于简单。结论是,任何物理系统中微观态的数量都是明确定义的,这个数量可能很大,非常大,但不是无限的。
在这个新的理论中,离散的微观态被称为“量子态”。
量子这个词源于马克斯·普朗克对光性质的结论。在 19 世纪,光的波动理论被普遍接受,因为它可以包含“所有”实验事实。然而,在 1900 年,普朗克在研究“黑体”发出的辐射及其辐射的频率分布时,得出了与波动理论不符的实验事实。他被迫得出结论,黑体辐射的能量存在于离散的量中,“波包”(“量子”)。不仅是黑体辐射,所有光和其他电磁辐射似乎都由这种波包组成,既是粒子又是波。
这种观点引发了一系列思考;从 1900 年到 1930 年,一门全新的物理学诞生了。
作为微型弹珠的原子经典概念似乎站不住脚;原子在许多方面都表现出类似于光量子的波包特征。
在以经典(牛顿)力学为基础的旧物理学中,可以取任何物体来观察其尺寸、重量和其他性质。它的运动是一个与这些性质完全不同的概念。
相反,波不能没有运动而存在;在量子力学中,粒子的存在和运动是同一事物的相互关联的方面。
显然,在经典力学经过几个世纪的成功应用之后,得出结论认为经典力学已经过时,必须被一种相当“荒谬”的力学所取代,这在科学界引起了质疑。幸运的是,量子力学和经典力学的结果在许多情况下似乎是相互对应的。特别是在正常温度下具有普通比例的系统中,两种理论的结果都一致。这个结论保持了经典力学先前结果的完整性,被称为“对应原理”。
在经典力学和波动力学的结果非常接近的情况下,可以自由选择将两种理论之一应用于同一物体,但在两种理论产生不同结果的情况下,应该优先选择波动力学。
作为一个例子,可以考虑最简单的情况,原子在一个维度上在两堵墙之间移动。从图 1 可以看出,在这种情况下,两种观点之间的差异非常大。从经典力学的角度来看,一个在两堵墙之间上下移动的原子,可以在任何水平x 上,并具有任何速度v,因此不同“状态”的数量是无限的。另一方面,在量子力学中,只处理驻波,因此可能状态的数量是明确定义的,中间状态是不可能的。
图 1。原子在一个维度上自由移动,如经典和波动力学所考虑的那样。
两幅图都代表了原子在一个维度上在两堵墙之间移动的视觉。在经典力学中,原子由微型弹珠表示,而在波动力学中,相同的原子由驻波表示。在第二种情况下,“状态”的数量是明确定义的,而在第一种情况下则不是。
因此,对于微观态的研究,我们必须求助于量子力学。在本例中,提到的驻波由波数 n 来表征,波数 n 是一个非零整数。每种波形都与它的特征能量相关联,特征能量与:n2 成正比。(在经典力学中,能量与 v2 成正比。)
一个粒子在一个维度上的驻波图案可能非常简单,一个粒子在三个维度上已经具有更复杂的波图案,用三个量子数来表征,例如在 x-y-z 空间中的数字:nx、ny 和 nz。当粒子在一个立方体容器中移动时,这种三维波图案与一个能量级相关联,能量级与: 成正比。
显然,一个以上粒子独立地在三维空间中移动的系统将表现出更加复杂的波形,当原子不自由,而在液体或晶体中相互接触时,将会出现更加复杂的协调波形,但始终是明确定义的。
在数学上,量子数 n 没有上限,但由于在实际系统中能量始终有其上限,因此量子数的大小也具有其上限。
例如,如果我们将量子数的上限设为:n = 10,则具有单维运动的可能波形数也为十个。对于具有三维运动的一个粒子,波形数将变为一千,而对于同一体积中的两个粒子,则变为一百万。按照这种推理,对于一个具有 N 个粒子在三维空间中运动的常见系统,可能的波形数将变为:,这是一个非常大的数字,并且始终是明确定义的。
对于现实系统,例如在实验室和技术环境中研究的系统,这种计算并不简单:量子数的上限始终远大于 10,而且粒子(原子)的数量通常很大,超过 。
尽管如此,计算仍然是可能的:早在 1916 年,萨库尔和特罗德就开发了一个复杂的公式来计算理想气体中可用的量子态数量,假设所有原子都在明确定义的体积中相互独立地运动(参见 w:萨库尔-特罗德方程),这是波动力学的一个重要表达式。该公式意味着相关的修正,其中最重要的是严格区分系统中存在的相同原子和不同原子。当交换两个不同的原子时,会产生一个新的量子态,但当交换两个相同的原子时,这种情况不会发生。
(这种严格的区分带来了“混合熵”现象,消除了经典热力学中存在的被称为“吉布斯悖论”的矛盾。)
使用萨库尔-特罗德公式进行的计算结果非凡:例如,在 1 摩尔氩气中,在 300 K 的温度和 1 巴的压力下(接近“理想气体”),“可用”量子态的数量变为
。确实很多,但不是无限的。
如此庞大的数字超出了我们的理解,对于任何计算都很难处理。对于计算,取指数:就足够了,它是g的“对数”(在公式中:log(g)),然后用适当的小因子乘以它。在热力学中,这是常见的做法,而为了方便起见,选择了“自然对数”(ln(g)),它大约是上面提到的 log(g) 的 2.3 倍。
以这种方式“驯服”的数字被称为“熵”,用符号S表示,在公式中
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (2)
上面提到的“适当”因子k始终是“玻尔兹曼常数”,大小为
J/K。
换句话说:熵是量子态数量的表示。使用公式(2),现在可以计算出上面提到的 1 摩尔氩气在 300 K 和 1 巴下的熵为:Sargon = 155 J/(molK)
第二定律
[edit | edit source]量子态的数量在物理平衡的建立中起着重要的作用,例如一杯茶的冷却、飞轮旋转的衰减等等。由于物理系统中这些量子态的数量非常大,因此同一系统中两个宏观状态之间的任何差异通常都与这些数量的相应巨大差异相耦合。
一个例子是具有两个不同温度的部分的系统,这些部分自发地向相同温度移动。考虑一个具有两个铜块(各 1 摩尔)的隔离系统,它们分别以 299 K 和 301 K 的温度开始,移动到两个铜块都为 300 K 的状态。铜的摩尔热容为 24.44 J/(molK)。
一个相对简单的计算表明,在这个过程中,熵增加了 0.00027 J/K,似乎是一个很小的增加,但它仍然很重要,因为它对应着量子态数量的巨大差异:该过程的影响是使数量增加了
能量保持恒定,所有这些量子态具有相同的概率,并且系统将在两种类型的巨大数量的量子态上盲目地游走,最终(几乎)肯定会出现在具有相同温度的宏观状态的某个量子态中,仅仅是受到数量巨大差异的驱动。(请参考图 2 中的“像素跳跃器”。)
图 2。色盲像素跳跃器。
这张图片是由一个有 100 000 个蓝色像素和 100 个红色像素的彩色区域组成的。仔细观察,读者可能会在红色区域发现一个黑色像素。假设这是一个“像素跳跃器”,它坐在一个红色像素上,我们可以想象它通过从一个(彩色)像素跳到另一个像素上来四处游走。所有像素具有相同的概率,很明显,经过一段时间后,找到跳跃器在蓝色像素上的概率比找到它在红色像素上的概率高 1000 倍。这种从红色到蓝色的移动不能归因于一种神秘的偏好,导致色盲跳跃器偏向蓝色,这种移动仅仅是由数量差异造成的。
对于所有实际目的,任何向具有更高熵的宏观状态的改变都可能发生,而其逆向变化的概率如此之低,以至于我们无法期望观察到它,即使是在数十亿年之后。在热力学中,我们将后面的说法简化为:“这是不可能的”。
以及
孤立系统的熵不能减少。这个说法是“热力学第二定律”。该定律的一个推论是,仅用一个热库将热量转换为功的永动机是不可能的,因为从热库中取出热量会降低系统的熵,而产生的功不会造成熵的变化。另一个推论是,可逆变化不会改变熵,因为减少是不可能的,而熵的增加会在反转后转化为减少。
熵和能量平衡
[edit | edit source]从完善的经典热力学中获取熵这个词,并将其用于一个完全不同的概念,似乎有点大胆。这并非没有理由。
这种理由可以在将迄今为止考虑的孤立系统与经典热力学中考虑的非孤立系统进行比较中找到。
孤立系统的能量处于狭窄的范围内,从: 到 ,考虑到在热力学中,dE 不像数学中那样趋近于零,因为量子态的数量也将趋近于零。在热力学中,当 dE 足够小,使所有划分内的量子态具有(接近)相同的概率时,通常会谈论“孤立系统”。尽管不为零,但这种 dE 的大小也很小,小到无法通过量热法检测出来。
与热浴接触的非孤立系统存在着截然不同的情况:系统的能量不断波动。概率 P 的钟形曲线(见图 3)可以被认为是由许多宽度为 dE 焦耳的等效划分组成,而在孤立状态下只存在一个划分。因此,可用量子态的数量显著增加。在一个包含 个原子的系统中,这些数字将增加超过 倍,导致对熵的微小贡献完全可以忽略不计。
这看起来像个奇迹:即使乘以一百万、十亿甚至一兆,这些大数的对数在所有实际目的上都没有改变。这个奇迹意味着人们可以自由地谈论“熵”S,无论系统是孤立的还是非孤立的。
在图 3 中,可以看到系统的概率 P 是由一个钟形曲线来描述的,这是两种相反效应的结果:随着能量的增加,量子态数量的增加和概率的减少。很容易计算出(见下面的验证),当数字平衡概率时,E=U 的水平正是统计方法和经典方法一致的能量水平,因此在平衡时,两种方法都会得出相同的结果。
因此,将我们上面使用的统计概念称为“熵”是正确的。
图 3。比较孤立系统和与热浴接触的系统。
在这两幅图中,纵坐标是系统处于能量水平 E 的概率。左边的图显示了“孤立”系统的情况,P 为单位:系统始终处于能量水平 U。右边的图显示了同一个系统处于与热浴平衡时的状态。由于热运动,它的能量围绕平均值 U 波动。这些波动太小,无法通过量热法检测出来,但在原子尺度上,它们很重要。
两种相反的趋势,即量子态数量的增加和概率随能量的减少,使得曲线开始上升,而在能量超过 U 时下降。
波动能量的一个有趣方面是钟形概率曲线内变化的可逆性。例如,当系统在图 3 中自发地从 E1 水平移动到 E2 水平时,可以确定,经过一段时间后,系统会自发地回到 E1。可逆过程在热力学中起着重要作用,它是这种可逆变化的链。
验证
[edit | edit source]在本章中,我们将证明我们在上面提出的一个重要论点,即统计方法和经典方法会导致相同的熵。
如上所述,经典熵和统计熵之间的一个区别是,统计熵是针对孤立系统定义的,而经典熵则是基于其在向与热浴接触的非孤立系统供热后的变化。因此,我们必须将非孤立系统与孤立系统进行比较,以追溯这两个定义之间可能存在的一致性。在与热浴接触时,由于来自热浴原子的冲击,系统的能量会不断波动,见上图 3。在图中,找到系统处于能量水平 E 的概率称为 P,或者更准确地说:P·dE 是找到系统处于 E 和 E+dE 之间间隔的能量水平的概率。这个间隔 dE 可以选择与我们之前称为“划分”的间隔相同,将整个函数划分为“划分”。
如上所述,两种相反的效应决定了概率 P,并导致其上下波动。一方面,量子态的数量随着能量水平的增加而增加,另一方面,这些量子态的概率根据所谓的玻尔兹曼因子而随着其能量的增加而减少。
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (3)
这两种效应在顶点处完全相互抵消,在该处 P-E 曲线水平通过
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (4)
这个公式是比较统计熵和经典熵定义的关键,即从函数 P 的公式中,可以通过微分来评估商(4),从而得到经典公式 (1)
dS = dQ/T。
这种评估可以按照以下步骤进行。可以将 E 和 E+dE 之间的划分概率公式作为起点
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (5)
函数 g 的定义方式是,g·dE 非常接近量子态的数量,这些量子态存在于 E 和 E+dE 之间。B 是玻尔兹曼因子,Z 是“配分函数”,它是归一化因子,这是为了确保所有概率的总和为单位:
.
对 (5) 进行微分得到
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (6)
当因子 为零时,该表达式变为零。并且由于 ,这意味着
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (7)
这种关系 (7) 的一个结果是,“熵单位”的维度必须是:焦耳每开尔文,J/K。
此外,当向系统可逆地供应热量时,可以注意其含义。
热量供应
[edit | edit source]当向系统可逆地供应 δQ 焦耳热量时,δQ 大于一个分区,平均能量 U 将增加:dU = δQ。假设 dS/dE 在热量供应过程中保持不变,我们从 (7) 得到
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (8)
随后,由于 dU = δQ,得到
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (9)
这与经典公式 (1) 相同,因此
统计熵与经典熵相同。
全微分
[edit | edit source]在定义了熵之后,可以像往常一样进行形式热力学及其应用,考虑全微分的数学概念,这意味着多个变量的函数。
例如,当 z = f(x,y) 是两个自变量 x 和 y 的单值函数时,该函数可以在直角坐标系中绘制,结果是一个曲面。热力学中考虑的函数是这样的,这个曲面始终是连续的,而且通常是轻微弯曲的。观察曲面上某一点 x,y 的运动,一个小移动可以是平行于 YZ 坐标平面的一个 dx 步长,使函数 z 增加 dz,这是 x 方向上的步长乘以相应的梯度
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (10)
这被称为函数 z 的“偏微分”。当随后在 y 方向上进行一步时,将添加相应的增加量,导致
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (11)
这个组合公式是函数 z 的“全微分”。
当向物理系统供应 dQ 焦耳热量和 dW 焦耳功时,能量将增加
dU = dQ + dW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (12)
由于 Q 和 W 不是状态函数,(12) 不能与全微分:(11) 进行比较,但可以将两项都代入以获得一个与状态函数 V 和 S 作为自变量的关系,更接近 (11)。当考虑一个由体积为 V、压力为 P 的气体组成的系统时,我们可以计算功为:dW=-PdV,而公式 (9) 意味着:dQ=TdS,并将两者代入 (12),结果为
dU = TdS – PdV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (13)
当满足两个条件时,这个关系 (13) 实际上就是函数 U(S,V) 的全微分,首先,在热量供应期间体积应该保持不变,其次,在功供应期间气体的熵必须保持不变。第一个条件很容易满足,而第二个条件也可以满足,即,例如,当有关的功可逆地来自或进入一个旋转的飞轮时,气体加上飞轮的熵在该变化过程中将保持不变,因为气体加上飞轮一起可以被认为是一个孤立的系统。因此,在状态变化过程中,气体的熵将保持不变,满足成为全微分的条件。所以 (13) 也可以写成
. . . . . . . . . . . . . . . . . . . . . . . . . . (14)
由此可知
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (15)
以及
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (16)
需要指出的是,以上关于“不涉及熵的功”的描述并非定性描述,而是定量描述。量子力学要求任何旋转的质量、分子或轮子都会产生相应的量子态,从而对熵产生贡献。这种贡献是可以计算的,结果表明对于宏观旋转物体而言,这种贡献几乎可以忽略不计。
从关系式 (14)、(15) 和 (16) 出发,我们可以利用全微分的性质来讨论卡诺循环、热泵、化学平衡以及热力学中的所有其他相关主题,这与所有教科书的做法完全一致。这样,本文的意图就达到了。