跳转到内容

感觉系统/听觉信号处理

来自维基教科书,开放的书籍,开放的世界

听觉信号处理

[编辑 | 编辑源代码]

既然已经概述了听觉系统的解剖结构,那么这个主题将更深入地探讨在感知声学信息并将其转化为大脑可以处理的数据过程中所发生的生理过程。听觉始于声波撞击耳道,最终由大脑感知。本节详细介绍了将振动转化为感知的过程。

头部影响

[编辑 | 编辑源代码]

波长短于头部的声音波会产生一个声影,该声影位于离声源较远的耳朵上。当波长长于头部时,声音的衍射会导致两只耳朵上产生大致相等的声音强度。

响度和时间上的差异有助于我们定位声音信号的来源。

耳廓的声波接收

[编辑 | 编辑源代码]

耳廓以其波纹形状收集空气中的声波,影响来自后面和前面的声音。声波会反射、衰减或放大。这些变化将有助于以后的声源定位。

在外耳道中,3 到 12 kHz 之间的声音 - 对人类交流至关重要的范围 - 会被放大。它充当共振器,放大传入的频率。

声音传导到耳蜗

[编辑 | 编辑源代码]

以波的形式进入耳廓的声音沿着耳道传播,直到到达中耳的起点,即鼓膜(耳膜)。由于内耳充满液体,中耳起着阻抗匹配装置的作用,以解决声音能量在从空气到液体的转换过程中反射的问题。例如,在从空气到水的转换过程中,99.9% 的传入声能会被反射。这可以使用以下公式计算


其中 Ir 为反射声音的强度,Ii 为传入声音的强度,Zk 为两种介质的波阻抗(Z空气 = 414 kg m-2 s-1 和 Z = 1.48*106 kg m-2 s-1)。有助于阻抗匹配的三个因素是

  • 鼓膜和卵圆窗之间相对大小的差异
  • 中耳听小骨的杠杆作用,以及
  • 鼓膜的形状。
中耳放大效应的力学机制。

声波的纵向气压变化会导致鼓膜振动,进而使三个链状听小骨锤骨、镫骨和砧骨同步振动。这些骨骼作为一个单元振动,将能量从鼓膜提升到卵圆窗。此外,声音能量还因膜和镫骨底板之间的面积差异而进一步增强。中耳充当阻抗变换器,将鼓膜收集的声音能量转换为更大的力,但位移更小。这种机制有助于将空气中的声波传递到耳蜗中的液体振动。这种转换是通过位于卵圆窗的镫骨底板的活塞式进出运动实现的。镫骨底板的这种运动使耳蜗中的液体运动起来。

通过镫骨肌,人体最小的肌肉,中耳具有门控功能:收缩此肌肉会改变中耳的阻抗,从而保护内耳免受响亮声音的损害。

耳蜗中的频率分析

[编辑 | 编辑源代码]

耳蜗的三个充满液体的隔室(前庭阶、蜗管、鼓阶)被基底膜和 Reissner 膜隔开。耳蜗的功能是根据声谱分离声音并将其转换为神经编码。当镫骨底板推入前庭阶的淋巴液时,Reissner 膜会弯曲进入蜗管。Reissner 膜的这种伸长会导致蜗管内的内淋巴液移动,并导致基底膜的位移。耳蜗中声频的分离是由于基底膜的特殊性质造成的。耳蜗中的液体振动(由于镫骨底板的进出运动),使膜像行波一样运动。波从底部开始,向耳蜗的顶端移动。基底膜中的横波以


其中 μ 为剪切模量,ρ 为材料的密度。由于基底膜的宽度和张力会发生变化,因此沿膜传播的波速从卵圆窗附近的约 100 m/s 变化到顶端附近的 10 m/s。

在基底膜上有一个点,波的振幅会突然下降。在这一点上,耳蜗液中的声波会产生基底膜的最大位移(峰值振幅)。波到达该特征点之前传播的距离取决于传入声音的频率。因此,基底膜上的每个点对应于特定值刺激频率。低频声音在到达其特征点之前传播的距离比高频声音远。频率沿着基底膜进行标定,高频位于基底,低频位于耳蜗的顶端。

行波最大振幅的位置 x 与刺激频率一一对应。

通过基底膜最大位移的位置识别频率称为频率的音调编码。它自动解决了两个问题

  • 它自动并行化了后续的频率处理。这种音调编码一直保持到皮层。
  • 我们的神经系统通过动作电位传递信息,动作电位的频率限制在 500 Hz 以下。通过音调编码,也可以准确地表示更高的频率。
动作电位具有典型的形状。并且由于在不应期期间 Na 离子通道被主动阻断,因此动作电位的最大频率约为 500 Hz - 明显低于人类语音所需的频率。

耳蜗的感官转导

[编辑 | 编辑源代码]

大多数日常声音是由多个频率组成的。大脑处理的是不同的频率,而不是完整的声音。由于基底膜的不均匀特性,它执行了对傅立叶变换的近似。因此,声音被分成不同的频率,并且膜上的每个毛细胞对应于某个特定频率。频率的响度由相应传入纤维的发射率编码。这是由于基底膜上传播波的振幅取决于传入声音的响度。

听觉或前庭毛细胞中的转导机制。将毛细胞倾斜朝向动纤毛会打开钾离子通道。这会改变毛细胞中的受体电位。由此产生的神经递质释放会诱发突触后细胞的动作电位 (AP)。
听觉毛细胞与前庭系统的毛细胞非常相似。这是一张青蛙的耳石器毛细胞的电子显微镜图像。
青蛙毛细胞的另一个例子。

听觉系统的感觉细胞,称为毛细胞,位于科蒂氏器内的基底膜上。每个科蒂氏器包含大约 16,000 个这样的细胞,由大约 30,000 个传入神经纤维支配。毛细胞有两种解剖学和功能上截然不同的类型:内毛细胞和外毛细胞。沿着基底膜,这两种类型排列在一排内细胞和三到五排外细胞中。大部分传入神经支配来自内毛细胞,而大部分传出神经支配来自外毛细胞。内毛细胞影响连接到这些毛细胞的单个听觉神经纤维的放电率。因此,内毛细胞将声音信息传递到更高层次的听觉神经中枢。相反,外毛细胞通过将能量注入膜的运动并减少摩擦损失来放大基底膜的运动,但不会参与声音信息的传递。基底膜的运动会使立体纤毛(毛细胞上的毛发)发生偏转,并导致毛细胞的细胞内电位下降(去极化)或升高(超极化),具体取决于偏转的方向。当立体纤毛处于静止位置时,会有一个稳态电流流过细胞的通道。因此,立体纤毛的运动会调节稳态电流周围的电流流动。

让我们分别看一下两种不同毛细胞类型的作用模式

  • 内毛细胞

毛细胞立体纤毛的偏转会打开机械门控离子通道,允许少量带正电的钾离子 (K+) 进入细胞并使其去极化。与许多其他电活性细胞不同,毛细胞本身不会发射动作电位。相反,来自前庭膜中的内淋巴的正离子流入会使细胞去极化,从而产生受体电位。这种受体电位会打开电压门控钙通道;然后钙离子 (Ca2+) 进入细胞并触发细胞基底端的神经递质释放。神经递质扩散穿过毛细胞和神经末梢之间狭窄的空间,在那里它们与受体结合,从而触发神经中的动作电位。通过这种方式,神经递质会增加第 VIII 对脑神经的发射率,并将机械声音信号转换为电神经信号。
毛细胞中的复极化以一种特殊的方式进行。鼓阶中的外淋巴中正离子浓度非常低。电化学梯度使正离子通过通道流向外淋巴。(另请参阅:维基百科 毛细胞

  • 外毛细胞

在人类外毛细胞中,受体电位会触发细胞体的主动振动。这种对电信号的机械响应称为体细胞电动性,并驱动细胞长度的振荡,振荡频率与传入声音的频率相同,并提供机械反馈放大。外毛细胞仅在哺乳动物中进化。如果没有功能性外毛细胞,灵敏度会降低约 50 dB(因为基底膜中的摩擦损失更大,这会阻尼膜的运动)。它们还提高了频率选择性(频率辨别),这对人类来说尤其有利,因为它能够实现复杂的发声和音乐。(另请参阅:维基百科 毛细胞

在没有外部刺激的情况下,听觉神经纤维以随机时间序列发射动作电位。这种随机时间发射称为自发活动。纤维的自发放电率从非常慢的速率到高达每秒 100 次的速率不等。根据纤维自发放电速率是高、中还是低,纤维被分为三组。自发放电率高的纤维(> 每秒 18 次)往往比其他纤维对声音刺激更敏感。

神经脉冲的听觉通路

[编辑 | 编辑源代码]
外侧丘系以红色显示,因为它连接着耳蜗核、上橄榄核和下丘。从后面看。

因此,在内毛细胞中,机械声音信号最终被转换为电神经信号。内毛细胞与听觉神经纤维连接,这些纤维的细胞核形成了螺旋神经节。在螺旋神经节中,电信号(电脉冲、动作电位)被产生并沿着听觉神经的耳蜗支(第 VIII 对脑神经)传递到脑干中的耳蜗核。

从那里,听觉信息被分成至少两条通路

  • 腹侧耳蜗核

一条通路是腹侧耳蜗核,它进一步分为腹后耳蜗核 (PVCN) 和腹前耳蜗核 (AVCN)。腹侧耳蜗核细胞投射到称为上橄榄复合体的核集合。

上橄榄复合体:声音定位

[编辑 | 编辑源代码]

上橄榄复合体——一小块灰质——被认为参与水平面(即它们相对于左侧或右侧的程度)上声音的定位。声音定位有两个主要线索:双耳水平差 (ILD) 和双耳时间差 (ITD)。ILD 测量两只耳朵之间的声音强度差异。这适用于高频(超过 1.6 kHz),其中波长小于两只耳朵之间的距离,从而导致头部阴影——这意味着高频声音以较低的强度击中偏离的耳朵。低频声音不会产生阴影,因为它们绕头部传播。然而,由于波长大于两只耳朵之间的距离,进入两只耳朵的声音波之间存在相位差——由 ITD 测量的计时差异。这对于低于 800 Hz 的频率非常精确,其中耳朵距离小于波长的一半。正中面(前、上、后、下)的声音定位通过外耳得到帮助,外耳形成方向选择性滤波器。

在那里,比较每只耳朵中声音信息的时差和响度差异。声音强度差异在侧上橄榄复合体中的细胞中处理,时间差异(运行时间延迟)在中上橄榄复合体中处理。人类可以检测到左右耳之间的计时差异低至 10 μs,对应于声音位置的约 1 度差异。这种对来自两只耳朵的声音信息的比较允许确定声音的来源方向。上橄榄核是第一个双耳信号汇聚并可以比较的节点。下一步,上橄榄复合体通过称为外侧丘系的轴突束将信息发送到下丘。下丘的功能是在将信息发送到丘脑和听觉皮层之前整合信息。有趣的是,附近的丘显示出听觉和视觉刺激的相互作用。

  • 背侧耳蜗核

背侧耳蜗核 (DCN) 分析声音的质量,并通过外侧丘系直接投射到下丘。

从下丘开始,来自腹侧和背侧耳蜗核的听觉信息传递到丘脑的听觉核,即内侧膝状核。内侧膝状核进一步将信息传递到初级听觉皮层,这是人类大脑中负责处理听觉信息的区域,位于颞叶。初级听觉皮层是参与声音意识感知的第一个中继站。

初级听觉皮层和高级听觉区

[编辑 | 编辑源代码]

到达初级听觉皮层(布罗德曼区 41 和 42)的声音信息。初级听觉皮层是参与声音意识感知的第一个中继站。众所周知,它具有音调拓扑组织,并执行听觉的基本功能:音高和音量。根据声音的性质(语音、音乐、噪音),它被进一步传递到高级听觉区。被认为是单词的声音由韦尼克区(布罗德曼区 22)处理。该区域参与理解书面语言和口语(言语理解)。声音的产生(言语表达)与布罗卡区(布罗德曼区 44 和 45)有关。说话时产生所需声音的肌肉由运动皮层的颜面区域收缩,运动皮层的这些区域是参与计划、控制和执行自愿运动功能的大脑皮层的区域。

大脑的侧表面,标有布罗德曼区编号。
华夏公益教科书