跳转至内容

感官系统/视觉系统

来自Wikibooks,开放世界中的开放书籍

一般来说,视觉系统依靠电磁 (EM) 波来为生物体提供更多关于其周围环境的信息。这些信息可能与潜在的配偶、危险和食物来源有关。不同的生物体具有不同的组成部分,构成了所谓的视觉系统。

眼睛的复杂程度从简单的眼点(仅仅是感光细胞的集合)到功能齐全的照相机眼不等。如果生物体具有不同类型的感光细胞,或对不同波长范围敏感的细胞,则理论上该生物体将能够感知颜色,或者至少能够感知颜色差异。偏振是电磁辐射的另一种特性,一些生物体可以检测到它,昆虫和头足类动物的准确度最高。

请注意,本文重点关注使用电磁波进行视觉。当然,一些生物体已经进化出其他方式来获得视觉,或者至少用额外的感官信息来补充它们所看到的。例如,鲸鱼或蝙蝠,它们使用回声定位。这在某种程度上可能是“看”,但并不完全正确。此外,“视觉”和“视觉的”这两个词通常与视觉波长范围内的电磁波相关联,视觉波长范围通常定义为人眼视觉的相同波长限制。

电磁波谱


由于某些生物体检测到的电磁波频率低于或高于人类,因此必须做出更好的定义。因此,我们将视觉波长范围定义为 300nm 到 800nm 之间的电磁波波长。这在某些人看来可能有些随意,但选择错误的限制会导致某些鸟类的部分视觉不被视为视觉。此外,在这个波长范围内,我们已经定义了某些生物体的热视觉,例如蛇,这些生物体的热视觉不被视为视觉。因此,蛇利用其对 5000nm 到 30,000nm(红外线)之间的电磁波敏感的颊窝器官,并非“看见”,而是以某种方式“感受”远处的事物。即使是失明的标本也被记录到可以瞄准和攻击特定的身体部位。

首先,我们将简要描述不同类型的视觉系统感官器官,然后详细解释人类视觉中的组成部分、人类视觉通路中的信号处理,最后以这些阶段产生的感知结果为例进行说明。

感官器官

[编辑 | 编辑源代码]

视觉,或称看见的能力,取决于视觉系统感官器官或眼睛。眼睛的构造多种多样,其复杂程度取决于生物体的需求。不同的构造具有不同的功能,对不同的波长敏感,具有不同的锐度,还需要不同的处理来理解输入,并且需要不同数量的眼睛才能达到最佳效果。检测和解读电磁波的能力已被证明对大多数生命形式来说都是一项宝贵的财富,从而增加了利用它的生物体的生存机会。在光线不足或完全没有光线的环境中,生命形式无法获得视觉的额外优势,这最终导致视觉感官器官萎缩,随后更多地依赖其他感官(例如,一些穴居动物、蝙蝠等)。有趣的是,视觉感官器官似乎被调整到光学窗口,光学窗口定义为穿过大气层到达地面的电磁波波长(300nm 到 1100nm)。如下图所示。您可能会注意到存在其他“窗口”,例如红外线窗口,这在一定程度上解释了蛇的热“视觉”,以及射频 (RF) 窗口,目前尚无已知的生命形式能够检测到它。

随着时间的推移,进化产生了多种眼睛构造,其中一些眼睛构造已经进化了多次,从而使具有相似生态位的生物体具有相似之处。有一个基本方面在本质上是相同的,无论物种或感官器官类型的复杂程度如何,都普遍使用称为视蛋白的光敏蛋白。虽然不专注于分子基础,但各种构造可以分为不同的组别。

  • 眼点
  • 颊窝眼
  • 针孔眼
  • 晶状体眼
  • 屈光角膜眼
  • 反光眼
  • 复眼

最简单的眼睛构造使生物体能够简单地感知环境光,使生物体能够知道是否有光。它通常只是同一位置上的一簇感光细胞的集合,因此有时被称为眼点、眼斑或单眼。通过添加更多角度结构或凹陷眼点,生物体也可以获得方向信息,这是图像形成的必要条件。这些所谓的颊窝眼是迄今为止最常见的视觉感官器官类型,在所有已知物种中超过 95% 都能找到。

针孔眼

将这种方法推向明显的极端会导致凹坑变成一个巨大的结构,这会提高图像的清晰度,但会损失强度。换句话说,强度或亮度与清晰度之间存在权衡。鹦鹉螺就是一个例子,鹦鹉螺属于鹦鹉螺科,被认为是活化石的有机体。它们是唯一已知具有这种类型的眼睛的物种,被称为针孔眼,它与针孔相机或暗箱完全类似。此外,与更先进的相机一样,鹦鹉螺能够调节光圈的大小,从而分别降低或提高眼睛的分辨率,以及降低或提高图像亮度。与相机一样,缓解强度/分辨率权衡问题的方法是加入一个透镜,这是一种将光聚焦到中心区域的结构,该区域通常具有更高的感光器密度。通过调整透镜的形状并将其移动,以及控制光圈或瞳孔的大小,生物体可以适应不同的条件并关注任何视觉场景中的特定感兴趣区域。前面提到的各种眼睛构造的最后一次升级是加入了折射性角膜。具有这种结构的眼睛将眼睛的总光学能力的三分之二委托给了角膜内部的高折射率液体,从而实现了非常高分辨率的视觉。大多数陆地动物,包括人类,都具有这种特殊的构造的眼睛。此外,透镜结构、透镜数量、感光器密度、中央凹形状、中央凹数量、瞳孔形状等也存在许多变化,始终是为了提高相关生物体的生存机会。这些变化导致眼睛的外观多种多样,即使在单一的眼部构造类别中也是如此。为了说明这一点,下面展示了一组具有相同眼部类别(折射性角膜眼)的动物照片。

屈光角膜眼
鹰眼
绵羊眼
猫眼
人眼
鳄鱼眼

例如在软体动物中可以找到一种称为反光眼的替代透镜方法。这些生物体没有使用透镜或透镜系统将光聚焦到眼睛后部的单一点的传统方式,而是在其眼腔内部具有镜面结构,这些结构将光反射到中心部分,就像抛物面天线一样。尽管没有已知的具有反光眼能够形成图像的生物体例子,但至少有一种鱼类,即幽灵鱼(Dolichopteryx longipes),将它们与“普通”的带透镜的眼睛结合使用。

复眼

最后一组眼睛,见于昆虫和甲壳类动物,称为复眼。这些眼睛由许多称为小眼的官能亚单位组成,每个小眼都由一个表面、一个透明的晶体锥和用于检测的光敏细胞组成。此外,每个小眼都由色素细胞隔开,确保入射光尽可能平行。每个小眼的输出组合形成马赛克图像,其分辨率与小眼单元的数量成正比。例如,如果人类有复眼,那么眼睛将覆盖我们的整个脸部才能保持相同的分辨率。需要注意的是,复眼有很多类型,但深入探讨这个话题超出了本文的范围。

不仅眼睛的类型不同,眼睛的数量也各不相同。正如您所知,人类通常有两只眼睛,而蜘蛛则有不同数量的眼睛,大多数物种有 8 只。通常,蜘蛛的不同对眼睛的大小也不同,不同的大小具有不同的功能。例如,在跳蛛中,2 只较大的前向眼睛赋予了蜘蛛出色的视觉敏锐度,主要用于瞄准猎物。6 只较小的眼睛分辨率较差,但有助于蜘蛛避开潜在的危险。展示蛛形纲动物眼睛拓扑结构的可变性,下面展示了跳蛛和狼蛛眼睛的两张照片。

视觉系统的解剖结构

[编辑 | 编辑源代码]

我们人类是视觉生物,因此我们的眼睛非常复杂,包含许多部件。在本章中,我们尝试描述这些部件,从而深入了解人类视觉的特性和功能。

进入眼球内部 - 瞳孔、虹膜和晶状体

[编辑 | 编辑源代码]

光线通过眼睛前部的黑色孔隙或瞳孔进入眼睛结构。黑色外观是由于光线被眼睛内部的组织完全吸收造成的。只有通过这个瞳孔,光线才能进入眼睛,这意味着入射光线的数量实际上由瞳孔的大小决定。围绕瞳孔的色素括约肌充当眼睛的光圈光阑。虹膜中色素的含量决定了人类眼睛的不同颜色。

除了这一层色素外,虹膜还有两层睫状肌。一层是称为瞳孔括约肌的环形肌,它收缩使瞳孔变小。另一层是称为瞳孔开大肌的平滑肌,它收缩使瞳孔放大。这些肌肉的组合可以根据人的需求或情况扩张/收缩瞳孔。睫状肌由睫状小带控制,睫状小带是纤维,它们还会改变晶状体的形状并将其固定到位。

晶状体位于瞳孔的正后方。它的形状和特性揭示了与相机镜头类似的目的,但它们的功能略有不同。晶状体的形状由睫状小带的拉力调节,从而改变焦距。晶状体与角膜一起可以改变焦点,这使得它成为一个非常重要的结构,然而,眼睛的总光学能力只有三分之一是由晶状体本身造成的。它也是眼睛的主要过滤器。晶状体纤维构成了晶状体的大部分物质,它们是细长的细胞,缺乏大部分细胞机制以促进透明度。它们与称为晶状体的可溶性蛋白质一起,增加了晶状体的折射率。纤维也参与晶状体本身的结构和形状。

人眼示意图

眼睛中的波束形成 - 角膜及其保护层 - 巩膜

[编辑 | 编辑源代码]
角膜的结构

角膜负责眼睛总光学能力的其余 2/3,覆盖着虹膜、瞳孔和晶状体。它在光线穿过晶状体之前聚焦穿过虹膜的光线。角膜仅有 0.5 毫米厚,由 5 层组成

  • 上皮:一层覆盖角膜表面的上皮组织。
  • 鲍曼膜:一层由强韧的胶原纤维组成的厚保护层,维持角膜的整体形状。
  • 基质:一层由平行的胶原原纤维组成的层。这一层占角膜厚度的 90%。
  • Descemet 膜和内皮:是两层调整到充满房水液的前房,房水液由睫状体产生。这种液体滋润晶状体,清洁它并维持眼球的压力。位于角膜和虹膜之间的房水,包含小梁网结构,通过该结构,液体通过 Schlemm 管排出,穿过后房。

角膜表面位于两个保护膜下方,称为巩膜和 Tenon 囊。这两个保护层都完全包裹着眼球。巩膜由胶原蛋白和弹性纤维构成,保护眼睛免受外部损伤,这一层也形成了眼睛的白膜。它被神经和血管穿透,最大的孔留给视神经。此外,它被结膜覆盖,结膜是眼球表面的一层透明粘膜。这种膜也衬在眼睑的内侧。它起到润滑剂的作用,并与泪腺一起产生泪液,润滑和保护眼睛。剩下的保护层,眼睑,也起着将这种润滑剂涂抹在周围的作用。

眼球运动 - 外眼肌

[编辑 | 编辑源代码]

眼球由复杂的肌肉结构外眼肌移动,包括四条直肌——下直肌、内直肌、外直肌和上直肌,以及两条斜肌——下斜肌和上斜肌。这些肌肉的位置以及功能如下所示

外眼肌:绿色 - 外直肌;红色 - 内直肌;青色 - 上直肌;粉色 - 下直肌;深蓝色 - 上斜肌;黄色 - 下斜肌。

如您所见,外眼肌(2、3、4、5、6、8)附着在眼球的巩膜上,并起源于 Zinn 环,Zinn 环是围绕视神经的纤维肌腱。通过滑车作为滑轮和上斜肌作为绳索,形成一个滑轮系统,这是为了以正确的方式重新引导肌肉力量。其余的外眼肌有通往眼睛的直接路径,因此不形成这些滑轮系统。使用这些外眼肌,眼睛可以向上、向下、向左、向右旋转,并且可以通过这些动作的组合实现其他运动。

其他运动对于我们能够看清事物也很重要。辐合运动使双眼视觉能够正常发挥作用。称为扫视的无意识快速运动对于人们保持物体聚焦至关重要。扫视是一种在眼睛扫描视野时进行的抖动运动,目的是稍微移动注视点。当您用目光跟随移动的物体时,您的眼睛会执行所谓的平滑追踪。称为眼球震颤的其他非自愿运动是由前庭系统发出的信号引起的,它们共同构成了前庭眼反射。

脑干控制着所有眼睛的运动,不同的区域负责不同的运动。

  • 脑桥:快速水平运动,例如扫视或眼球震颤
  • 中脑:垂直和旋转运动
  • 小脑:微调

  • 埃丁格-韦斯特法尔核:辐辏运动

视觉接收发生的地方——视网膜

[编辑 | 编辑源代码]
角膜、晶状体和色素上皮对光线的过滤

在进行光转导之前,入射的电磁辐射会穿过角膜、晶状体和黄斑。这些结构也充当过滤器,以减少不需要的电磁辐射,从而保护眼睛免受有害辐射的伤害。在“角膜、晶状体和色素上皮对光线的过滤”图中可以看到每个元素的过滤响应。可以观察到,角膜衰减较低波长的光,而对较高波长的光几乎没有影响。晶状体阻挡了大约 25% 的低于 400nm 的电磁辐射,以及超过 50% 的低于 430nm 的电磁辐射。最后,色素上皮是光感受之前最后的过滤阶段,它会影响大约 30% 的 430nm 到 500nm 之间的电磁辐射。

眼睛的一部分,标志着从非感光区域到感光区域的过渡,被称为锯齿缘。感光区域被称为视网膜,它是眼睛后部的感光结构。视网膜由多个层组成,如下所示,包含数百万个称为视杆细胞和视锥细胞的光感受器,它们捕获光线并将它们转换为电脉冲。这些脉冲的传递由神经节细胞神经性地启动,并通过视神经传导,视神经是信息离开眼睛的唯一途径。

视网膜结构,包括主要细胞成分:RPE:视网膜色素上皮;OS:感光细胞外段;IS:感光细胞内段;ONL:外核层;OPL:外丛状层;INL:内核层;IPL:内丛状层;GC:神经节细胞层;P:色素上皮细胞;BM:布鲁赫膜;R:视杆细胞;C:视锥细胞;H:水平细胞;B:双极细胞;M:穆勒细胞;A:无长突细胞;G:神经节细胞;AX:轴突;箭头:外界膜。

右侧显示了视网膜结构的概念图解。正如我们所看到的,主要有五种细胞类型

  • 感光细胞
  • 水平细胞
  • 双极细胞
  • 无长突细胞
  • 神经节细胞

感光细胞可以进一步细分为两种主要类型,称为视杆细胞和视锥细胞。在视网膜的大部分区域,视锥细胞的数量远少于视杆细胞,但在黄斑中,尤其是在其称为中央凹的中心区域,视锥细胞的数量非常多。在这个中心区域,每个感光视锥细胞都连接到一个神经节细胞。此外,该区域的视锥细胞略小于平均视锥细胞的大小,这意味着每个区域可以容纳更多的视锥细胞。由于这种比例和视锥细胞的高密度,这是我们视觉敏锐度最高的地方。

视锥细胞和视杆细胞在人眼视网膜上的分布

人眼有三种视锥细胞,每种视锥细胞由于三种称为视蛋白的色素而对特定波长范围的光线做出反应。每种色素对红光、蓝光或绿光的波长敏感,因此我们有蓝色、绿色和红色视锥细胞,也称为 S 型、M 型和 L 型视锥细胞,分别代表它们对短波长、中波长和长波长的敏感性。它由称为视蛋白的蛋白质和称为视黄醛的结合发色团组成。视锥细胞的主要组成部分是突触末梢、内段和外段、内部细胞核和线粒体。

三种视锥细胞的光谱敏感性

  • 1. S 型视锥细胞吸收短波光,即蓝紫光。S 型视锥细胞的最大吸收波长为 420nm
  • 2. M 型视锥细胞吸收蓝绿色到黄色的光。在这种情况下,最大吸收波长为 535nm
  • 3. L 型视锥细胞吸收黄色到红色的光。最大吸收波长为 565nm
视锥细胞结构

内段包含细胞器和细胞核以及细胞器。色素位于外段,作为跨膜蛋白附着在膜上,位于细胞膜的内陷中,形成膜盘,在显示视杆细胞和视锥细胞基本结构的图中可以清楚地看到这些膜盘。这些盘状结构最大化了细胞的接收面积。许多脊椎动物的视锥细胞光感受器包含称为油滴的球形细胞器,据认为它们构成了眼内过滤器,可以增加对比度,减少眩光并减少由线粒体从外周到中心的尺寸梯度引起的色差。

视杆细胞的结构与视锥细胞相似,但它们包含视紫红质而不是视蛋白,这使得它们能够检测低强度光,并且比视锥细胞敏感 100 倍。视紫红质是人类视杆细胞中唯一发现的色素,它位于色素上皮的外侧,与视锥细胞类似,通过采用盘状结构来最大化吸收面积。与视锥细胞类似,细胞的突触末梢将其与双极细胞连接起来,内段和外段由纤毛连接。

视紫红质吸收 400-600nm 之间的光,最大吸收波长约为 500nm。此波长对应于蓝绿色光,这意味着在夜间,蓝色比红色看起来更强烈。

视杆细胞结构
视锥细胞和视杆细胞在可见电磁辐射范围内的敏感性

波长超出 400-700nm 范围的电磁波既不被视杆细胞也不被视锥细胞检测到,这最终意味着它们对人类来说是不可见的。

水平细胞位于视网膜的内核层。有两种类型的水平细胞,并且这两种类型的细胞都会因光而超极化,即它们变得更负。A 型包含一种称为 HII-H2 的亚型,它主要与 S 型视锥细胞相互作用。B 型细胞具有一种称为 HI-H1 的亚型,它具有树突树和轴突。前者主要接触 M 型和 L 型视锥细胞,后者接触视杆细胞。与视锥细胞的接触主要是通过抑制性突触实现的,而细胞本身则通过间隙连接连接成网络。

人眼视网膜的横截面,红色表示双极细胞。

双极细胞在外丛状层中延伸单个树突,其细胞体(胞体)位于内核层。树突专门与视锥细胞和视杆细胞相互连接,我们区分一个视杆双极细胞和九个或十个视锥双极细胞。这些细胞使用轴突在内丛状层中与无长突细胞或神经节细胞分支。视杆双极细胞连接到三联突触或 18-70 个视杆细胞。它们的轴突在内丛状层突触末梢周围延伸,这些突触末梢包含带状突触并接触二联突触中的一对细胞突起。它们通过 AII 无长突细胞连接与神经节细胞连接。

无长突细胞可以在视网膜的内核层和神经节细胞层中找到。偶尔,它们也会出现在内丛状层中,在那里它们充当信号调节器。根据其大小,它们被归类为窄视野、小视野、中视野或宽视野。然而,存在许多分类,导致超过 40 种不同类型的无长突细胞。

神经节细胞是将视觉信号从视网膜传递到大脑的最终传递者。视网膜中最常见的神经节细胞是矮小神经节细胞和伞状神经节细胞。信号在通过所有视网膜层后,传递给这些细胞,这些细胞是视网膜处理链的最后阶段。所有信息都收集在这里,然后转发到视网膜神经纤维和视神经。神经节细胞轴突融合形成视神经的地方称为视盘。该神经主要由视网膜神经节细胞轴突和波特细胞构成。大多数轴突将数据传递到外侧膝状体核,它是神经大部分区域的终止枢纽,并将信息转发到视觉皮层。一些神经节细胞也会对光做出反应,但由于这种反应比视杆细胞和视锥细胞的反应慢,因此据信它与感知环境光水平和调整生物钟有关。

信号处理

[编辑 | 编辑源代码]

如前所述,视网膜是眼睛的主要组成部分,因为它包含所有感光细胞。如果没有它,眼睛将类似于没有 CCD(电荷耦合器件)传感器的数码相机。本部分详细阐述了视网膜如何感知光线,光学信号如何传递到大脑,以及大脑如何处理信号以形成足够的信息进行决策。

初始信号的产生 - 光感受器功能

[编辑 | 编辑源代码]

视觉始于光线照射到视网膜中的感光细胞。视网膜杆状细胞和锥状细胞中的光吸收视色素、各种酶和递质,将可见电磁刺激转化为电脉冲,这一过程称为光电转换。以视杆细胞为例,进入的可见电磁辐射照射到视紫红质分子上,视紫红质分子是存在于视杆细胞外盘结构中的跨膜分子。每个视紫红质分子都包含一个称为视蛋白的螺旋簇,包围着11-顺式视黄醛,这是分子中会因进入光子的能量而发生变化的部分。在生物分子中,由于这种能量而导致构象变化的部分或分子片段有时被称为发色团。11-顺式视黄醛响应进入的能量而伸直,转变为全反式视黄醛,这迫使视蛋白螺旋进一步分开,导致特定的反应位点暴露出来。这种“激活”的视紫红质分子有时被称为视紫红质II。从这一点开始,即使可见光刺激停止,反应也会继续。然后,视紫红质II可以与大约100个称为转导蛋白的Gs蛋白分子反应,然后在GDP转化为GTP后产生αs和βγ。激活的αs-GTP随后与cGMP磷酸二酯酶(PDE)结合,抑制正常的离子交换功能,导致细胞质中阳离子浓度降低,从而导致细胞极化发生变化。

天然的光电转换反应具有惊人的放大能力。单个视紫红质分子被单个光量子激活,每秒可导致高达106个cGMP分子水解。

光转导
[编辑 | 编辑源代码]
光激活中分子步骤的示意图(修改自Leskov等,2000)。描绘了视杆细胞中的外膜盘。步骤1:入射光子(hν)被吸收并通过盘膜中视紫红质的构象变化激活R*。步骤2:接下来,R*与转导蛋白分子反复接触,通过释放结合的GDP并交换胞质GTP来催化其激活为G*(步骤3)。α和γ亚基G*与磷酸二酯酶(PDE)的抑制性γ亚基结合,激活其α和β亚基。步骤4:激活的PDE水解cGMP。步骤5:鸟苷酸环化酶(GC)合成cGMP,它是光转导级联反应中的第二信使。细胞质cGMP水平降低导致环核苷酸门控通道关闭,阻止Na+和Ca2+进一步内流。
  1. 光子与光感受器中的视黄醛相互作用。视黄醛发生异构化,从11-顺式构型转变为全反式构型。
  2. 视黄醛不再适合视蛋白结合位点。
  3. 因此,视蛋白发生构象变化,转变为视紫红质II。
  4. 视紫红质II不稳定并分裂,产生视蛋白和全反式视黄醛。
  5. 视蛋白激活调节蛋白转导蛋白。这导致转导蛋白与其结合的GDP分离,并结合GTP,然后转导蛋白的α亚基与其β和γ亚基分离,GTP仍然与α亚基结合。
  6. α亚基-GTP复合物激活磷酸二酯酶。
  7. 磷酸二酯酶将cGMP分解为5'-GMP。这降低了cGMP的浓度,因此钠通道关闭。
  8. 钠通道的关闭导致细胞由于持续的钾电流而超极化。
  9. 细胞的超极化导致电压门控钙通道关闭。
  10. 随着感光细胞中钙水平下降,细胞释放的神经递质谷氨酸的量也下降。这是因为谷氨酸囊泡与细胞膜融合并释放其内容物需要钙。
  11. 感光细胞释放的谷氨酸量减少导致中间神经元“ON型”双极细胞(视杆和视锥“ON型”双极细胞)去极化和视锥“OFF型”双极细胞超极化。

在没有可见电磁刺激的情况下,含有离子、蛋白质和其他分子的视杆细胞具有约-40mV的膜电位差。与其他神经细胞相比,这相当高(-65mV)。在这种状态下,神经递质谷氨酸持续从轴突末梢释放并被邻近的双极细胞吸收。随着可见电磁辐射的进入和前面提到的级联反应,电位差下降到-70mV。这种细胞的超极化导致释放的谷氨酸量减少,从而影响双极细胞的活性,并随后影响视觉通路中的后续步骤。

视锥细胞和感光神经节细胞中也存在类似的过程,但使用不同的视蛋白。视蛋白I到III(分别为黄绿色、绿色和蓝紫色)存在于三种不同的视锥细胞中,而黑视蛋白(蓝色)存在于感光神经节细胞中。

视网膜信号处理

[编辑 | 编辑源代码]

不同的双极细胞对释放的谷氨酸的变化反应不同。所谓的“ON型”和“OFF型”双极细胞用于形成从视锥细胞到双极细胞的直接信号流。“ON型”双极细胞将通过可见电磁刺激去极化,相应的“ON型”神经节细胞将被激活。另一方面,“OFF型”双极细胞通过可见电磁刺激超极化,“OFF型”神经节细胞被抑制。这是直接信号流的基本途径。侧向信号流将从视杆细胞开始,然后传递到双极细胞、无长突细胞和“OFF型”双极细胞,这些细胞被视杆-无长突细胞抑制,“ON型”双极细胞通过电突触被刺激,在所有这些步骤之后,信号将到达“ON型”或“OFF型”神经节细胞,并且侧向信号流的整个通路建立起来。

当“ON型”神经节细胞中的动作电位(AP)由可见电磁刺激触发时。“ON型”神经节细胞的动作电位频率将随着感受器电位增加而增加。换句话说,动作电位取决于感受器电位的幅度。神经节细胞中刺激和抑制效应影响动作电位频率的区域称为感受野(RF)。在神经节细胞周围,感受野通常由两个区域组成:中心区和环状周边区。它们在可见电磁适应过程中是可以区分的。中心区上的可见电磁刺激可能导致动作电位频率增加,而周边区上的刺激将降低动作电位频率。当光源关闭时,就会发生兴奋。因此,名称“ON型”感受野(中心区“ON型”)指的是这种类型的区域。当然,“OFF型”神经节细胞的感受野作用方式相反,因此被称为“OFF型”感受野(中心区“OFF型”)。感受野由水平细胞组织。周边区域的脉冲将被脉冲并传递到中心区域,并在那里形成所谓的刺激对比。此功能将使黑暗看起来更暗,光线看起来更亮。如果整个感受野都暴露在光线下,中心区域的脉冲将占主导地位。

信号传递到大脑皮层

[编辑 | 编辑源代码]

如前所述,神经节细胞的轴突在视网膜的视盘处汇聚,形成视神经。这些纤维在束内以特定的顺序排列。来自视网膜黄斑区的纤维位于中心部分,而来自视网膜颞侧半部的纤维占据周边部分。当这些纤维在眼腔外时,会发生部分交叉或交叉。来自每个视网膜鼻侧半部的纤维交叉到对侧半部并延伸到大脑。来自颞侧半部的纤维保持未交叉。这种部分交叉称为视交叉,视交叉之后的视神经称为视束,主要是为了将其与单个视网膜神经区分开来。部分交叉的功能是将双眼产生的右侧视野信息仅传递到大脑的左侧半部,反之亦然。因此,来自身体右侧和右侧视野的信息在到达前脑后部(间脑)时都会传递到大脑的左侧部分。

到中央皮层的通路

视束纤维和神经细胞之间的信息传递发生在位于大脑丘脑的视觉信号处理中心——外侧膝状体。从这里,信息传递到大脑对应侧枕叶皮层的神经细胞。来自视网膜到大脑的连接可以分为“小细胞通路”和“大细胞通路”。小细胞通路信号颜色和精细细节,而大细胞通路检测快速移动的刺激。

来自视网膜到大脑的连接可以分为“小细胞通路”和“大细胞通路”。小细胞通路起源于视网膜中的小细胞,并传递颜色和精细细节;大细胞通路始于伞细胞,并检测快速移动的刺激。

来自标准数码相机的信号大致对应于小细胞通路的信号。为了模拟小细胞通路的反应,研究人员一直在开发神经形态传感系统,试图模拟神经系统中基于脉冲的计算。因此,他们在神经形态电子系统中使用了一种称为“地址事件表示”的方案来进行信号传输(Liu和Delbruck 2010 [1])。

在解剖学上,视网膜的大细胞和小细胞神经节细胞分别投射到外侧膝状核(LGN)的2个腹侧大细胞层和4个背侧小细胞层。六个LGN层中的每一个都接收来自同侧眼或对侧眼(即左眼的视网膜神经节细胞交叉并投射到右LGN的第1、4和6层,右眼的视网膜神经节细胞投射(未交叉)到其第2、3和5层)的输入。从这里,来自左右眼的信息被分开。

尽管人类视觉是由视网膜的两半组合而成,信号由对侧大脑半球处理,但视觉场被认为是一个平滑而完整的单元。因此,这两个视觉皮层区域被认为是紧密相连的。这种连接称为胼胝体,由神经元、轴突和树突组成。由于树突与半球的相关点形成突触连接,因此对一个半球上的每个点的电刺激都会导致对另一个半球上互连点的刺激。这条规则的唯一例外是初级视觉皮层。

突触由视束在侧膝状体的各个层中形成。然后,这些三级神经细胞的轴突向上传递到大脑皮层每个枕叶的距状沟。因为它是由视网膜神经细胞中的白纤维和轴突带对穿过它而形成的,所以它被称为纹状皮层,这恰好是我们的初级视觉皮层,有时被称为V1。在这一点上,来自不同眼睛的冲动汇聚到共同的皮层神经元,然后使一个区域中来自两只眼睛的完整输入能够用于感知和理解。模式识别是这部分大脑的一个非常重要的功能,病变会导致视觉识别问题或盲视。

基于视束纤维以有序的方式将信息传递到侧膝状体,然后传递到纹状区,如果发现了视网膜上的一个单点刺激,那么在侧膝状体和纹状皮层中产生的电反应将在特定视网膜斑点上的一个小区域被发现。这是一种明显的点对点信号处理方式。如果刺激整个视网膜,则反应将发生在侧膝状体和纹状皮层灰质区域。可以将这个大脑区域映射到视网膜视野,或者更常见的是视觉视野。

本书不讨论这条通路中的任何后续步骤。请放心,存在许多更高级别和中心,专注于特定任务,例如颜色、方向、空间频率、情绪等。

视觉系统中的信息处理

[编辑 | 编辑源代码]

在更深入地了解视觉系统信号处理的一些重要概念后,对处理过的感官信息的理解或感知是拼图中最后一块重要的拼图。视觉感知是将眼睛接收到的信息转化为对外部事物状态的理解的过程。它使我们意识到周围的世界,并让我们更好地理解它。基于视觉感知,我们学习模式,然后在以后的生活中应用这些模式,并根据这些模式和获得的信息做出决策。换句话说,我们的生存依赖于感知。由于处理过程过于复杂,需要不同的专门机制来感知所看到的事物,因此视觉感知领域已被划分为不同的子领域。这些子领域包括:颜色感知、运动感知、深度感知和人脸识别等。

灵长类视觉皮层的深层层次结构

[编辑 | 编辑源代码]
视觉系统中的深层层次结构

尽管电子系统的计算能力不断增强,但在许多任务中,动物和人类仍然远远优于计算机——其中一项就是信息的感知和语境化。经典计算机,无论是手机中的计算机还是占据整个房间的超级计算机,本质上都是一个数字运算器。它可以在极短的时间内执行海量的计算。它缺乏的是对其正在处理的信息进行抽象。如果将摄像头连接到电脑上,它“感知”到的图像只是一张像素网格,一个二维数字数组。而人类会立即识别场景的几何形状、图像中的物体,甚至可能识别正在发生的事情的上下文。我们这种能力是由专门的生物机制提供的——大脑的视觉系统。它以分层的方式处理我们看到的所有事物,从图像的简单特征开始,到更复杂的特征,一直到将物体分类到类别中。因此,视觉系统被认为具有深层层次结构。灵长类视觉系统的深层层次结构启发了计算机科学家创建人工神经网络模型,这些模型也具有多个层,其中每一层都对输入数据创建更高的泛化。

大约一半的人类新皮层专门用于视觉。视觉信息的处理至少发生在10个功能层级上。早期视觉区域的神经元在视觉空间的小局部区域内提取简单的图像特征。随着信息传递到更高的视觉区域,神经元对越来越复杂的特征做出反应。随着信息处理层级的提高,表示变得更加不变——对精确的特征大小、旋转或位置不太敏感。此外,较高视觉区域神经元的感受野大小增加,表明它们被调整到更全局的图像特征。这种层次结构允许高效计算——不同的较高视觉区域可以使用在较低区域计算的相同信息。早期视觉区域中生成的通用场景描述被大脑的其他部分用于完成各种不同的任务,例如物体识别和分类、抓取、操作、运动计划等。

皮层下视觉

[编辑 | 编辑源代码]

视觉信息的处理早在任何皮层结构之前就已经开始了。视网膜上的感光细胞检测光线并将信号发送到视网膜神经节细胞。感光细胞的感受野大小为一度的百分之一(当你的手臂伸直在你面前时,一度大的感受野大约是你拇指的大小)。神经节细胞的输入数量及其感受野大小取决于位置——在视网膜中心,它接收来自少至五个受体的信号,而在周围,单个细胞可以有数千个输入。这意味着最高的空间分辨率位于视网膜中心,也称为中央凹。由于此特性,灵长类动物拥有一个注视控制机制,该机制引导视线,以便感兴趣的特征投射到中央凹上。

神经节细胞被选择性地调整以检测图像的各种特征,例如亮度对比度、颜色对比度以及运动的方向和速度。所有这些特征都是进一步处理管道中使用的主要信息。如果存在神经节细胞无法检测到的视觉刺激,那么这些刺激也无法用于任何皮层视觉区域。

神经节细胞投射到丘脑中的一个区域,称为外侧膝状体核(LGN),后者又将信号传递到皮层。目前还没有发现LGN中发生任何重要的计算——视网膜神经节细胞和LGN细胞之间几乎存在一对一的对应关系。然而,只有5%的LGN输入来自视网膜——所有其他输入都是皮层反馈投射。尽管视觉系统通常被认为是一个前馈系统,但循环反馈连接以及横向连接是整个视觉皮层中常见的一个特征。反馈的作用尚未完全清楚,但有人提出将其归因于诸如注意力、期望、想象以及填补缺失信息等过程。

皮层视觉

[编辑 | 编辑源代码]
视觉系统的主要区域

视觉皮层可以分为三个大区域——枕叶区域,它接收来自LGN的输入,然后将输出发送到背侧和腹侧通路。枕叶区域包括V1-V4和MT区域,它们处理视觉信息的各个方面并产生通用场景表示。背侧通路参与空间分析和动作计划。腹侧通路参与物体识别和分类。

V1是第一个处理视觉信息的皮层区域。它对边缘、光栅、线端、运动、颜色和视差(点在左右视网膜上的投影之间的角度差)敏感。层次化自下而上处理的最直接示例是来自几个具有中心-周围感受野的神经节细胞的输入的线性组合,以创建条形的表示。这是由V1的简单细胞完成的,并且首先由著名的神经科学家Hubel和Wiesel描述。这种信息整合意味着简单细胞对条形的确切位置敏感,并且具有相对较小的感受野。V1的复杂细胞接收来自简单细胞的输入,并且虽然也对线性方向模式做出反应,但它们对条形的确切位置不敏感,并且具有更大的感受野。此步骤中存在的计算可能是一个类似于MAX的操作,该操作产生的响应幅度类似于与各个刺激相关的较大响应。一些简单细胞和复杂细胞也可以检测条形的末端,并且一部分V1细胞也对其各自感受野内的局部运动敏感。

V2区域具有更复杂的轮廓表示,包括纹理定义的轮廓、虚幻轮廓和具有边界所有权的轮廓。V2还在V1中的绝对视差检测的基础上构建,并且具有对相对视差敏感的细胞,即空间中两点之间绝对视差的差异。V4区域接收来自V2和V3区域的输入,但关于V3中发生的计算知之甚少。V4区域具有对具有不同曲率的轮廓和具有特定角度的顶点敏感的神经元。另一个重要特征是亮度不变色调的编码。这与V1形成对比,在V1中,神经元响应沿两个主轴(红-绿和黄-蓝)的颜色对立,而不是实际的颜色。V4进一步输出到腹侧通路,到颞下皮层(IT),通过损伤研究表明,颞下皮层对于物体辨别至关重要。

颞下皮层:物体辨别

[编辑 | 编辑源代码]
TE区域中的刺激减少

下颞叶皮层 (IT) 分为两个区域:TEO 和 TE。TEO 区域整合有关多个轮廓元素的形状和相对位置的信息,并且主要包含对特征的简单组合做出反应的细胞。TEO 神经元的感受野大小约为 3-5 度。TE 区域包含感受野明显更大的细胞(10-20 度),这些细胞对人脸、手和复杂的特征配置做出反应。TE 中的细胞对视觉特征做出反应,这些特征是对感兴趣物体更简单的概括,但比简单的条形或斑点更复杂。田中等人使用刺激减少方法证明了这一点,首先测量对物体的反应,然后用更简单的表示替换物体,直到将 TE 神经元正在响应的关键特征缩小范围。

IT 中的神经元似乎将腹侧通路中较低层级的各种中等复杂度的特征整合在一起,以构建物体部件的模型。对特定物体有选择性的 TE 中的神经元必须满足两个看似矛盾的要求——选择性和不变性。它们必须通过对视网膜图像中特征的敏感性来区分不同的物体。然而,同一个物体可以从不同的角度和距离在不同的光照条件下观察,产生同一个物体的差异很大的视网膜图像。为了将所有这些图像视为等价,必须导出对某些变换(例如位置、照明、视网膜上的大小等变化)具有鲁棒性的不变特征。TE 区域的神经元显示出对位置和大小以及部分遮挡、深度位置和照明方向的不变性。深度旋转已被证明具有最弱的不变性,除非物体是人脸。

物体类别在 TE 区域中尚未明确存在——一个神经元可能通常对同一类别的几个但不包括所有样本做出反应(例如,树的图像),并且它也可能对不同类别的样本做出反应(例如,树和非树)。物体识别和分类很可能涉及从更大数量的 TE 神经元中采样,以及接收来自其他大脑区域的输入,例如负责理解场景上下文的大脑区域。最近的读出实验表明,可以训练统计分类器(例如支持向量机)根据少量 TE 神经元的反应来对物体进行分类。因此,原则上,TE 神经元群体可以通过其组合活动可靠地发出物体类别的信号。有趣的是,也有一些关于内侧颞叶中高度选择性神经元的报道,这些神经元对非常特定的线索做出反应,例如不同图像中的比萨斜塔或特定人的面孔。

视觉系统中的学习

[编辑 | 编辑源代码]

学习可以改变神经元的视觉特征选择性,学习的效果在更高的层次结构级别上变得更强。目前没有关于视网膜学习的已知证据,并且 V1 中的方向图似乎在很大程度上是由基因预先决定的。然而,练习方向识别可以通过增加调谐曲线的斜率来改善 V1 神经元的方向编码。在 V4 中观察到了类似但更大的效果。在 TE 区域,很少有视觉训练对视觉感知产生明显的生理影响,无论是在单细胞水平上还是在 fMRI 上。例如,将两个物体相互变形会增加它们之间的感知相似性。总的来说,似乎即使是成年视觉皮层也具有相当大的可塑性,并且可塑性水平可以显着提高,例如通过服用特定药物或生活在丰富环境中。

深度神经网络

[编辑 | 编辑源代码]

与灵长类动物视觉系统的深度层次结构类似,深度学习架构试图通过使用多级非线性变换来对输入数据的较高层次抽象进行建模。Hubel 和 Wiesel 提出的模型,其中信息从视网膜和 LGN 级联整合并传播到 V1 中的简单细胞和复杂细胞,启发了第一个深度学习架构之一——神经认知机(neocognitron)的创建,这是一种多层人工神经网络模型。它被用于不同的模式识别任务,包括手写字符的识别。然而,训练网络需要很长时间(以天为单位),并且自 20 世纪 80 年代诞生以来,深度学习直到 21 世纪初随着数字数据的大量涌现和更快的训练算法的发明才受到广泛关注。深度神经网络已证明自己在不久前似乎只有人类才能执行的任务中非常有效,例如识别照片中特定人员的面孔、理解人类语音(在某种程度上)以及翻译外语文本。此外,它们已被证明对工业和科学有很大的帮助,例如寻找潜在的候选药物、绘制大脑中真实神经网络的图谱以及预测蛋白质的功能。必须注意的是,深度学习只是非常松散地受到大脑的启发,并且更像是计算机科学/机器学习领域的成就,而不是神经科学的成就。基本相似之处在于深度神经网络由以非线性方式整合信息输入的单元(神经元)组成,并相互发送信号(突触),并且存在数据表示的抽象程度不断提高的不同级别。深度学习中使用的“神经元”的学习算法和数学描述与大脑中发生的实际过程非常不同。因此,深度学习的研究,虽然极大地推动了更复杂的人工智能的发展,但只能对大脑提供有限的见解。

神经元及其主要组成部分的示例。
神经网络基本单元的示例。在本例中,激活函数是整流线性单元 (ReLU),但也存在其他可能性,包括 sigmoid 或双曲正切函数。偏差改变了单元的激活阈值,因此它类似于神经元动作电位阈值。
深度神经网络示例。每个正方形代表上图中描述的一个单元。

参考文献

[编辑 | 编辑源代码]
关于视觉系统中深度层次结构的论文
  • Kruger, N.; Janssen, P.; Kalkan, S.; Lappe, M.; Leonardis, A.; Piater, J.; Rodriguez-Sanchez, A. J.; Wiskott, L. (2013 年 8 月)。“灵长类视觉皮层中的深度层次结构:我们能从计算机视觉中学到什么?”。IEEE 模式分析与机器智能汇刊35(8):1847–1871。doi:10.1109/TPAMI.2012.272.
  • Poggio, Tomaso; Riesenhuber, Maximilian (1999 年 11 月 1 日)。自然神经科学2(11):1019–1025。doi:doi:10.1038/14819. {{cite journal}}: 检查 |doi= 值(帮助缺少或为空 |title=帮助
刺激减少实验
视觉系统中学习的证据

  • Li, Nuo; DiCarlo, James J. (2010年9月23日). "无监督自然视觉体验快速重塑下颞叶皮层中大小不变的目标表征". 神经元. 67 (6): 1062–1075. doi:10.1016/j.neuron.2010.08.029.
  • Raiguel, S.; Vogels, R.; Mysore, S. G.; Orban, G. A. (2006年6月14日). "学会识别差异会特异性地改变信息量最大的V4神经元". 神经科学杂志. 26 (24): 6589–6602. doi:10.1523/JNEUROSCI.0457-06.2006.
  • Schoups, A; Vogels, R; Qian, N; Orban, G (2001年8月2日). "练习方向识别提高了V1神经元的方向编码". 自然. 412 (6846): 549–53. PMID 11484056.
深度学习研究现状的最新且易于理解的概述
  • Jones, Nicola (2014年1月8日). "计算机科学:学习机器". 自然. 505 (7482): 146–148. doi:10.1038/505146a.

运动知觉

[编辑 | 编辑源代码]

运动知觉是推断运动物体速度和方向的过程。人类的V5区和灵长类动物的MT(中颞叶)区负责运动的皮层感知。V5区是纹外皮层的一部分,纹外皮层是大脑枕叶中靠近初级视觉皮层的一个区域。V5区的功能是检测视觉刺激的速度和方向,并将局部视觉运动信号整合为全局运动。V1区或初级视觉皮层位于大脑两个半球的枕叶中。它处理视觉信息皮层处理的第一阶段。该区域包含眼睛覆盖的视野的完整地图。V5区和V1区(初级视觉皮层)的区别在于,V5区可以将局部信号或物体各个部分的运动整合到整个物体的全局运动中。另一方面,V1区对感受野内发生的局部运动做出反应。来自这些众多神经元的估计值在V5区中被整合。

运动被定义为视网膜光照在空间和时间上的变化。运动信号被分为一阶运动二阶运动。这些运动类型将在以下段落中简要描述。

“β运动”的示例。

一阶运动知觉是指当两个或多个视觉刺激随时间开启和关闭并产生不同的运动知觉时感知到的运动。一阶运动也被称为“表观运动”,它用于电视和电影中。一个例子是“β运动”,这是一种错觉,其中固定的图像似乎在移动,即使它们在现实中并没有移动。这些图像呈现出运动的外观,因为它们的变化和移动速度超过了眼睛可以检测到的速度。这种视觉错觉发生是因为人类视神经以每秒十次的频率响应光线变化,因此任何快于此速率的变化都将被记录为连续运动,而不是作为单独的图像。

二阶运动是指当移动轮廓由对比度、纹理、闪烁或其他不会导致图像亮度或运动能量增加的质量定义时发生的运动。证据表明,一阶运动和二阶运动的早期处理是由不同的通路进行的。二阶机制具有较差的时间分辨率,并且在它们响应的空间频率范围内是低通的。二阶运动会产生较弱的运动后效。一阶和二阶信号在V5区中被组合。

在本章中,我们将分析运动知觉和运动分析的概念,并解释为什么这两个术语不应互换使用。我们将分析感知运动的机制,例如运动传感器和特征跟踪。存在三种主要的理论模型试图描述运动神经元传感器的功能。已经进行了实验测试以确认这些模型是否准确。不幸的是,这些测试的结果是不确定的,可以说这些模型中没有一个完全描述了运动传感器的功能。但是,这些模型中的每一个都模拟了运动传感器的某些特征。描述了这些传感器的某些特性。最后,本章展示了一些运动错觉,这些错觉表明我们的运动感可能会被静态外部因素所误导,这些因素以与运动相同的方式刺激运动传感器。

运动分析和运动知觉
[编辑 | 编辑源代码]

运动分析运动知觉的概念经常被混淆为可互换的。运动知觉和运动分析彼此重要,但它们并不相同。

运动分析是指处理运动信号的机制。与运动知觉不一定依赖于视网膜图像运动产生的信号类似,运动分析可能导致也可能不导致运动知觉。这种现象的一个例子是vection,当一个人感知到自己在移动时,而她实际上是静止的,但她观察到的物体在移动。vection表明可以分析物体的运动,即使它不被感知为来自物体的运动。运动分析的这种定义表明运动是图像的基本属性。在视野中,它在每个点都被分析。分析的结果用于推导出感知信息。

运动知觉是指获取有关图像中物体和表面运动的感知知识的过程。运动是通过视网膜中精细的局部传感器或通过特征跟踪来感知的。局部运动传感器是专门对运动敏感的神经元,类似于专门的颜色传感器。特征跟踪是一种间接感知运动的方式,它包括根据物体随时间推移在视网膜位置的变化来推断运动。它也被称为三阶运动分析。特征跟踪通过将注意力集中到特定物体并观察其位置随时间推移如何变化来工作。

运动传感器
[编辑 | 编辑源代码]

运动检测是视觉处理的第一阶段,它得益于专门的神经过程,这些过程响应有关图像强度随时间局部变化的信息。运动在图像的所有位置独立于其他图像属性进行感知。已经证明运动传感器存在,并且它们在图像的所有点上都在局部运行。运动传感器是位于视网膜中的专用神经元传感器,能够检测由两个短暂且微弱的光闪所产生的运动,这两个光闪如此接近以至于特征跟踪无法检测到。存在三种主要的模型试图描述这些专门的传感器的工作方式。这些模型彼此独立,并且试图模拟运动知觉的特定特征。尽管没有足够的证据支持任何这些模型代表视觉系统(特别是运动传感器)感知运动的方式,但它们仍然正确地模拟了这些传感器的某些功能。

两种不同的运动检测机制。左)“Reichardt检测器”由两个镜像对称的子单元组成。在每个子单元中,在两个相邻点测量的亮度值在其中一个被具有时间常数τ的低通滤波器延迟后相互相乘(M)。乘法器的输出信号最终被减去。右)在梯度检测器中,在一个感光器(δI/δt,左)之后测量的亮度时间梯度除以亮度空间梯度(δI/δx)。在这里,空间梯度由两个相邻点亮度值的差值来近似。

Reichardt检测器

莱卡特探测器用于模拟运动传感器如何响应一阶运动信号。当物体从视觉区域的A点移动到B点时,会产生两个信号:一个在运动开始前,另一个在运动完成后。该模型通过检测视网膜上一点的亮度变化,并将其与短时间延迟后附近另一点的亮度变化相关联来感知这种运动。莱卡特探测器基于相关性(涉及依赖性的统计关系)的原理进行操作。它通过相邻点的亮度信号的时空相关性来解释运动信号。它利用了这样一个事实:移动物体轨迹上不同点的两个感受野接收到的同一信号的时间偏移版本——亮度模式沿轴移动,轴上某一点的信号是轴上先前信号的时间偏移版本。莱卡特探测器模型有两个空间上分离的相邻探测器。探测器的输出信号以如下方式相乘(相关):一个信号乘以另一个信号,该信号是原始信号的时间偏移版本。重复相同的过程,但运动方向相反(时间偏移的信号成为第一个信号,反之亦然)。然后,取这两个乘法的差值,结果给出运动速度。探测器的响应取决于刺激的相位、对比度和速度。需要许多以不同速度调整的探测器来编码图案的真实速度。这种探测器最有说服力的实验证据来自对几乎不可见的靶标的方向辨别研究。


运动能量滤波

运动能量滤波器是一种基于相位不变滤波器原理的运动传感器模型。该模型构建了在时空定向的空间-时间滤波器,以匹配移动图案的结构。它由可分离滤波器组成,其中空间轮廓在时间上保持相同的形状,但按时间滤波器的值缩放。运动能量滤波器通过将可分离滤波器加在一起来匹配移动图案的结构。对于每个运动方向,生成两个时空滤波器:一个是对称的(条状),另一个是非对称的(边缘状)。这些滤波器的平方和称为运动能量。两个方向信号的差异称为对抗能量。然后将此结果除以另一个滤波器的平方输出,该滤波器调整为静态对比度。执行此除法是为了考虑对比度对运动的影响。运动能量滤波器可以模拟许多运动现象,但它产生了一个与相位无关的测量值,该测量值随速度增加,但不能提供可靠的速度值。


时空梯度


这种运动传感器模型最初是在计算机视觉领域开发的,它基于这样一个原理:图像亮度的时域导数与图像亮度的空域导数之比给出了运动速度。需要注意的是,在图像的峰值和谷值处,该模型将无法计算出足够的答案,因为分母中的导数将为零。为了解决这个问题,还可以分析关于空间和时间的二阶及更高阶空间导数。时空梯度是确定图像中所有点运动速度的一个很好的模型。

运动传感器具有方向选择性
[编辑 | 编辑源代码]

运动传感器的特性之一是方向选择性,它将运动分析限制在一个维度上。运动传感器只能记录沿垂直于传感器首选方向的轴线的一个维度上的运动。包含单个方向特征的刺激只能看到沿垂直于刺激方向的方向移动。一维运动信号关于二维物体的运动提供了模棱两可的信息。为了确定二维物体或图案的真实运动方向,需要进行第二阶段的运动分析。来自调整到不同方向的传感器的 1D 运动信号组合在一起以产生明确的 2D 运动信号。二维运动分析取决于来自局部宽方向传感器以及来自窄方向传感器的信号。

特征跟踪
[编辑 | 编辑源代码]

我们感知运动的另一种方式是通过特征跟踪。特征跟踪包括分析物体的局部特征是否改变了位置,并根据此变化推断运动。在本节中,提到了关于特征跟踪器的一些特征。

当移动刺激非常快速地发生时,特征跟踪器会失效。与运动传感器相比,特征跟踪器具有优势,即使运动被间歇性的空白间隔隔开,它们也能感知物体的运动。它们还可以分离这两个阶段(运动和空白间隔)。另一方面,运动传感器只会将空白与移动刺激整合在一起,并看到连续的运动。特征跟踪器根据识别特征的位置进行操作。因此,它们具有一个最小距离阈值,该阈值与可以区分特征位置的精度相匹配。特征跟踪器不会显示运动后效应,运动后效应是由视觉适应引起的视觉错觉。当观察到移动刺激后,静止物体似乎沿先前观察到的移动刺激的反方向移动时,就会发生运动后效应。这种机制不可能同时监控视觉区域不同部分的多个运动。另一方面,对于运动传感器来说,多个运动不是问题,因为它们在整个视觉区域内并行操作。

已经使用上述信息进行了实验,以得出关于特征跟踪器的有趣结论。对简短刺激的实验表明,特征跟踪器无法感知高对比度的颜色图案和对比度图案,但运动传感器可以感知。对空白间隔的实验证实,特征跟踪可以在显示屏中出现空白间隔的情况下发生。只有在高对比度下,运动传感器才能感知色度刺激和对比度图案的运动。在低对比度下,特征跟踪器分析色度图案和对比度包络的运动,而在高对比度下,运动传感器分析对比度包络。在受试者进行多个运动判断的实验中表明,特征跟踪是在意识控制下进行的过程,并且是我们分析低对比度显示屏中对比度包络运动的唯一方法。这些结果与以下观点一致:对比度包络和颜色图案的运动取决于特征跟踪,除非颜色远高于阈值或平均对比度很高。这些实验的主要结论是,可能是特征跟踪使得能够感知对比度包络和颜色图案。

运动错觉
[编辑 | 编辑源代码]

由于运动检测过程的工作方式,一些静态图像可能会让我们看起来像在移动。这些图像让我们了解了视觉系统所做的假设,被称为视觉错觉。

与一阶运动信号相关的著名运动错觉是phi现象,这是一种光学错觉,使我们感知运动而不是图像序列。这种运动错觉使我们能够将电影看作连续体,而不是单独的图像。phi现象允许以恒定速度变化的一组冻结图像被视为恒定的运动。phi现象不应与β运动混淆,因为前者是由一系列发光脉冲引起的表观运动,而后者是由发光静止脉冲引起的表观运动。

当运动感知、运动分析以及这些信号的解释具有误导性时,就会发生运动错觉,我们的视觉系统会产生关于运动的错觉。这些错觉可以根据允许它们发生的进程进行分类。错觉被归类为与运动感测、二维整合和三维解释相关的错觉。

关于运动感测最流行的错觉是四冲程运动、RDK和二阶运动信号错觉。关于二维整合最流行的运动错觉是运动捕捉、格子运动和直接排斥。类似地,关于三维解释的错觉是变换运动、运动深度、阴影运动、生物运动、立体运动、隐式图形运动和双冲程运动。还有更多运动错觉,它们都展示了关于人类运动检测、感知和分析机制的一些有趣的东西。有关更多信息,请访问以下链接:http://www.lifesci.sussex.ac.uk/home/George_Mather/Motion/

未解决的问题
[编辑 | 编辑源代码]

尽管我们对运动感知的大多数细节仍然缺乏了解,但理解运动感知的机制以及运动错觉可以使读者对该主题的最新研究状况有一个很好的概述。关于运动感知的一些未解决的问题包括全局运动中 3D 图像的形成机制和 *孔径问题*。

来自视网膜的全局运动信号被整合以形成二维全局运动信号;然而,3D 全局运动是如何形成的尚不清楚。孔径问题之所以出现,是因为视觉系统中的每个感受野只覆盖视觉世界的一小部分,这导致感知上的模糊性。孔径问题指的是移动轮廓在局部观察时与不同的运动可能性一致的问题。这种模糊性源于几何学 - 无法检测到平行于轮廓的运动,因为这种运动分量的变化不会改变通过孔径观察到的图像。唯一可以测量的分量是垂直于轮廓方向的速度;因此,运动的速度可以是速度空间中一条线上任何运动的组合。这种孔径问题不仅在直线轮廓中观察到,而且在平滑弯曲的轮廓中也观察到,因为它们在局部观察时近似于直线。虽然解决孔径问题的机制仍然未知,但存在一些关于如何解决它的假设。例如,可以通过组合来自空间或同一物体不同轮廓的信息来解决这个问题。

在本节中,我们介绍了运动感知以及我们的视觉系统检测运动的机制。运动错觉展示了运动信号如何具有误导性,并因此导致对运动的错误结论。重要的是要记住,运动感知和运动分析并不相同。运动传感器和特征跟踪器相互补充,使视觉系统感知运动。

运动感知很复杂,它仍然是一个开放的研究领域。本章描述了关于运动传感器功能的模型,以及关于特征跟踪器特征的假设;然而,需要更多的实验来了解这些机制的特征,并能够构建更准确地模拟视觉系统实际过程的模型。

本章中描述的各种运动分析和运动感知机制,以及为描述它们而设计的复杂人工模型表明,大脑皮层处理外部环境信号的方式非常复杂。数千个专门的神经元整合和解释局部信号片段,在大脑中形成移动物体的全局图像。理解我们的身体中有如此多的参与者和过程必须协同工作才能感知运动,这使得我们人类能够如此轻松地做到这一点,这一点更加令人惊奇。

颜色感知

[编辑 | 编辑源代码]

人类(以及猴子和猩猩等灵长类动物)在哺乳动物中拥有最好的颜色感知能力[1]。因此,颜色在广泛的方面发挥重要作用并非巧合。例如,颜色可用于区分和识别物体、表面、自然景观,甚至面部[2],[3]。颜色也是非语言交流的重要工具,包括情感的表达[4]

几十年来,找到颜色物理特性与其感知特性之间联系一直是一个挑战。通常,这些是在两种不同的方法下进行研究的:颜色引起的行为反应(也称为 *心理物理学*)以及它引起的实际生理反应[5]

这里我们只关注后者。颜色视觉生理基础的研究,在二十世纪下半叶之前几乎一无所知,自 1950 年以来稳步发展。在许多领域取得了重要进展,尤其是在受体水平。多亏了分子生物学方法,才有可能揭示先前未知的有关视锥色素遗传基础的细节。此外,越来越多的皮层区域被证明受到视觉刺激的影响,尽管颜色感知与波长相关的生理活动(超出受体)的相关性并不那么容易辨别[6]

在本节中,我们的目标是解释颜色感知沿视觉通路不同过程的基础,从眼睛的视网膜到大脑的视觉皮层。有关解剖学细节,请参阅本维基教科书“视觉系统的解剖结构”部分。

视网膜上的颜色感知

[编辑 | 编辑源代码]

人类可以区分的所有颜色都可以通过仅仅三种原色(基本颜色)的混合产生。受这种颜色混合思想的启发,有人提出颜色是由三类传感器支持的,每类传感器对可见光谱的不同部分具有最大的敏感性[1]。1853 年首次明确提出,正常颜色匹配存在三个自由度[7]。这后来在 1886 年得到证实[8](结果与最近的研究非常接近[9][10])。

这些提议的颜色传感器实际上就是所谓的视锥细胞(注意:在本节中,我们只处理视锥细胞。视杆细胞仅在低光照条件下对视觉有贡献。尽管已知它们对颜色感知有影响,但其影响非常小,可以忽略不计。)[11]视锥细胞是视网膜中发现的两种感光细胞类型之一,其中视锥细胞在中央凹处大量集中。下表列出了三种类型的视锥细胞。这些通过不同类型的视紫红质色素来区分。它们相应的吸收曲线显示在下图中。

表 1:视网膜中发现的视锥细胞类型的一般概述。
名称 对颜色的较高敏感性 吸收曲线峰值 [nm]
S、SWS、B 蓝色 420
M、MWS、G 绿色 530
L、LWS、R 红色 560
Absorption curves for the different cones. Blue, green, and red represent the absorption of the S (420 nm), M (530 nm), and L (560 nm) cones, respectively.
不同视锥细胞的吸收曲线。蓝色、绿色和红色分别表示 S(420 nm)、M(530 nm)和 L(560 nm)视锥细胞的吸收。

虽然尚未就不同视锥细胞类型的命名达成共识,但最广泛使用的名称要么指其光谱作用峰值,要么指它们本身敏感的颜色(红色、绿色、蓝色)[6]。在本文本中,我们将使用 S-M-L 名称(分别代表短波长、中波长和长波长),因为这些名称更具描述性。蓝绿红命名法有些误导,因为所有类型的视锥细胞都对较大范围的波长敏感。

三种视锥细胞的一个重要特征是它们在视网膜上的相对分布。事实证明,S 视锥细胞在整个视网膜中的浓度相对较低,在中央凹的最中心区域完全不存在。实际上,它们的间距太宽,无法在空间视觉中发挥重要作用,尽管它们能够介导弱边界感知[12]。中央凹主要由 L 视锥细胞和 M 视锥细胞支配。后两种视锥细胞的比例通常以比率来衡量。L/M 比率的报道值各不相同,从 0.67[13]到 2[14]不等,后者是最被接受的。为什么 L 视锥细胞几乎总是多于 M 视锥细胞仍然不清楚。令人惊讶的是,相对视锥细胞比率对颜色视觉几乎没有显着影响。这清楚地表明大脑具有可塑性,能够理解它接收到的任何视锥细胞信号[15][16]

同样重要的是要注意 L 视锥细胞和 M 视锥细胞吸收光谱的重叠。虽然 S 视锥细胞吸收光谱是明显分开的,但 L 视锥细胞和 M 视锥细胞的峰值仅相隔约 30 纳米,其光谱曲线也存在显着重叠。这导致这两种视锥细胞类别的光子捕获高度相关。这是因为为了在中央凹中心获得尽可能高的视敏度,视觉系统平等地对待 L 视锥细胞和 M 视锥细胞,而没有考虑它们的光谱吸收。因此,任何类型的差异都会导致亮度信号下降[17]。换句话说,L 视锥细胞和 M 视锥细胞光谱之间的微小分离可以解释为高对比度颜色视觉和高敏度亮度视觉需求之间的折衷。这与中央凹中心部分缺乏 S 视锥细胞相一致,在该区域视敏度最高。此外,L 视锥细胞和 M 视锥细胞吸收光谱的紧密间距也可以用它们的遗传起源来解释。这两种视锥细胞类型被认为是从一个共同祖先进化而来(大约 3500 万年前),而 S 视锥细胞可能在更早的时候从祖先受体分离出来[11]

三种不同类型视锥细胞的光谱吸收函数是人类颜色视觉的标志。该理论解决了一个长期存在的问题:尽管我们可以看到数百万种不同的颜色(人类可以区分 700 万到 1000 万种不同的颜色[5]),但我们的视网膜根本没有足够的空间来容纳每个颜色在每个视网膜位置的单个检测器。

从视网膜到大脑

[编辑 | 编辑源代码]

从视网膜传递到更高层次的信号不是受体信号的简单逐点表示,而是受体信号的复杂组合。本节的目的是简要介绍其中一些信息所走的路径。

一旦视网膜上的光学图像被转换为感光细胞中的化学和电信号,幅度调制信号就会在神经节细胞和更高层次转换为频率调制表示。在这些神经细胞中,信号的大小用细胞每秒发出的电压尖峰数来表示,而不是用细胞膜上的电压差来表示。为了解释和表示这些细胞的生理特性,我们会发现感受野的概念非常有用。

感受野是视觉场中给定细胞响应区域的图形表示。此外,通常会为感受野中的各个区域指示响应的性质。例如,我们可以将感光细胞的感受野视为一个小圆形区域,表示该特定受体在视觉场中的敏感度大小和位置。下图显示了神经节细胞的示例感受野,通常表现为中心-周围拮抗。图中左侧的感受野说明了正中心响应(称为中心激活)。这种类型的响应通常是由单个视锥细胞的正输入产生的,周围是几个相邻视锥细胞产生的负响应。因此,该神经节细胞的响应将由具有正负号的各种视锥细胞的输入组成。通过这种方式,细胞不仅对光点做出反应,而且充当边缘(或更准确地说,斑点)检测器。类似于计算机视觉术语,我们可以将神经节细胞响应视为与边缘检测内核进行卷积的输出。图中右侧的感受野说明了负中心响应(称为中心抑制),这同样可能。通常,中心激活和中心抑制细胞将出现在相同空间位置,由相同的感光细胞供给,从而导致动态范围增强。

下图显示,除了空间拮抗之外,神经节细胞还可以具有光谱对抗。例如,下图左侧说明了红绿对抗响应,中心由 L 视锥细胞的正输入供给,周围由 M 视锥细胞的负输入供给。另一方面,下图右侧说明了该细胞的中心抑制版本。因此,在视觉信息甚至离开视网膜之前,处理就已经发生了,这对颜色外观产生了深远的影响。还有其他类型和种类的神经节细胞响应,但它们都共享这些基本概念。

Antagonist receptive fields (on center)
中心激活
Antagonist receptive fields (off center)
中心抑制
拮抗感受野
Spectrally and spatially antagonist receptive fields (on center)
中心激活
Spectrally and spatially antagonist receptive fields (off center)
中心抑制
光谱和空间拮抗感受野。

在通往初级视觉皮层途中,神经节细胞轴突聚集形成视神经,投射到丘脑的背侧外侧膝状体核(LGN)。视神经中的编码效率很高,将神经纤维的数量降到最低(受视神经大小的限制),从而也使视网膜盲点的尺寸尽可能小(大约 5° 宽,7° 高)。此外,对于均匀照明,所呈现的神经节细胞将没有响应,因为正负区域是平衡的。换句话说,传输的信号是不相关的。例如,自然场景中相邻部分的信息在空间上高度相关,因此高度可预测[18]。相邻视网膜神经节细胞之间的侧抑制最大限度地减少了这种空间相关性,从而提高了效率。我们可以将其视为在视网膜上执行的图像压缩过程。

鉴于 L 视锥细胞和 M 视锥细胞吸收光谱的重叠,它们的信号也高度相关。在这种情况下,通过组合视锥细胞信号来最大限度地减少所述相关性,从而提高编码效率。我们可以使用主成分分析 (PCA) 更容易地理解这一点。PCA 是一种统计方法,用于通过将原始变量转换为一组新的变量(主成分 (PC))来降低给定变量集的维数。第一个 PC 占原始变量中最大量的总方差,第二个 PC 占第一个成分未解释的最大量的方差,依此类推。此外,PC 在参数空间中是线性无关且正交的。PCA 的主要优点是只需要少数几个最强的 PC 就能覆盖系统的大部分可变性[19]。该方案已用于视锥细胞吸收函数[20],甚至用于自然发生的光谱[21][22]。在自然物体产生的视锥细胞激发空间中发现的 PC 是 1) 亮度轴,其中 L 视锥细胞和 M 视锥细胞信号相加 (L+M),2) L 视锥细胞和 M 视锥细胞信号的差 (L-M),以及 3) 色彩轴,其中 S 视锥细胞信号与 L 视锥细胞和 M 视锥细胞信号之和的差 (S-(L+M))。这些从数学/计算方法导出的通道与在电生理实验中发现的三个视网膜-膝状体通道一致[23][24]。使用这些机制,视觉冗余信息在视网膜中被消除。

实际上,有三个信息通道将此信息从视网膜通过神经节细胞传递到 LGN。它们不仅在色度特性上有所不同,而且在解剖结构上也存在差异。这些通道对基本颜色任务(如检测和辨别)构成重要限制。

在第一个通道中,L 视锥细胞和 M 视锥细胞的输出协同传递到弥漫性双极细胞,然后传递到 LGN 的大细胞层 (M-) 中的细胞(不要与视网膜的 M 视锥细胞混淆)[24]。M 细胞的感受野由中心和周围组成,它们在空间上是拮抗的。M 细胞对亮度刺激具有高对比度敏感性,但在 L-M 对抗输入的某些组合下没有反应[25]。但是,由于不同 M 细胞的零点略有不同,因此总体响应永远不会真正为零。该特性实际上被传递到以 M 细胞输入为主的皮层区域[26]

视网膜小细胞通路(P-)起源于L或M锥体细胞到微型双极细胞的单个输出。这些为视网膜P细胞提供输入[11]。在中央凹,P细胞的感受野中心由单个L或M锥体细胞形成。P细胞感受野周围的结构仍在争论中。然而,最被接受的理论认为,周围是由特定类型的锥体细胞构成,从而产生针对亮度刺激的空间对立感受野[27]。小细胞层贡献了大约80%的从视网膜到外侧膝状体的总投射[28]

最后,最近发现的中间细胞通路(K-)主要携带来自S锥体细胞的信号[29]。这类锥体细胞的群体投射到特殊的双极细胞,而这些双极细胞又为特定的小的神经节细胞提供输入。这些神经节细胞通常不是空间对立的。小的神经节细胞的轴突投射到外侧膝状体的薄层(邻近小细胞层)[30]

虽然神经节细胞确实终止于外侧膝状体(与外侧膝状体细胞形成突触),但神经节细胞和外侧膝状体细胞之间似乎存在一一对应关系。外侧膝状体似乎充当信号的中继站。然而,它可能具有一些视觉功能,因为存在从皮层返回到外侧膝状体的突触,这可能作为某种类型的切换或适应反馈机制。外侧膝状体细胞的轴突投射到枕叶视觉皮层中的视觉区域一(V1)。

大脑中的颜色感知

[edit | edit source]

在皮层中,来自大细胞、小细胞和中间细胞通路的投射终止于初级视觉皮层的不同层。大细胞纤维主要支配4Cα层和6层。小细胞神经元主要投射到4Cβ层以及4A层和6层。中间细胞神经元终止于1、2和3层中富含细胞色素氧化酶(CO-)的斑点[31]

一旦进入视觉皮层,视觉信息的编码变得更加复杂。以相同的方式,各种光感受器的输出被组合和比较以产生神经节细胞反应,各种外侧膝状体细胞的输出被比较和组合以产生皮层反应。随着信号在皮层处理链中进一步向上推进,这个过程会重复,复杂程度迅速增加,以至于感受野开始失去意义。然而,一些功能和过程已在视觉皮层的特定区域得到识别和研究。

在V1区域(纹状皮层),双对立神经元——神经元在其感受野中关于单个感受野的开/关区域在色度和空间上都相反——比较跨越视觉空间的颜色信号[32]。它们占V1细胞的5%到10%。它们的大小粗糙,比例小,这与颜色视觉的空间分辨率差相匹配[1]。此外,它们对运动刺激的方向不敏感(与其他一些V1神经元不同),因此不太可能参与运动感知[33]。然而,鉴于它们专门的感受野结构,这类细胞是颜色对比效应的神经基础,也是编码颜色本身的有效手段[34],[35]。其他V1细胞对其他类型的刺激做出反应,例如定向边缘、各种空间和时间频率、特定的空间位置以及这些特征的组合等等。此外,我们可以找到线性组合来自外侧膝状体细胞的输入的细胞,以及执行非线性组合的细胞。这些反应是支持高级视觉能力(例如颜色本身)所必需的。

(Partial) flow diagram illustrating the many streams of visual information processes that take place in the visual cortex. It is important to note that information can flow in both directions.
图4. 说明视觉皮层中发生的许多视觉信息处理流的(部分)流程图。需要注意的是,信息可以双向流动。

与V1相比,关于V2中单个神经元的色度特性的信息要少得多。乍一看,V1和V2的颜色编码似乎没有主要区别[36]。一个例外是出现了一类新的颜色复杂细胞[37]。因此,有人认为V2区域参与了色调的细化。然而,这仍然存在很大争议,尚未得到证实。

遵循在发现V1中的功能性眼优势后发展起来的模块化概念,并考虑到P-、M-和K-通路之间的解剖学分离(在第3节中描述),有人建议视觉皮层中应该存在一个专门用于分析颜色信息的系统[38]。V4是历史上最受关注的可能的大脑“颜色区域”。这是因为一项有影响力的研究声称V4包含100%的色调选择性细胞[39]。然而,这一说法已被许多后续研究质疑,一些研究甚至报告说只有16%的V4神经元显示色调调整[40]。目前,最被接受的概念是,V4不仅有助于颜色,还有助于形状感知、视觉注意和立体视觉。此外,最近的研究集中在其他大脑区域,试图找到大脑的“颜色区域”,例如TEO[41]和PITd[42]。这些区域彼此之间的关系仍在争论中。为了调和讨论,一些人使用术语后下颞叶(PIT)皮层来表示包含V4、TEO和PITd的区域[1]

如果V1、V2和V4细胞中的皮层反应已经是一项非常复杂的任务,那么在近30个视觉区域网络中复杂视觉反应的复杂程度是巨大的。图4显示了已识别出的不同皮层区域(而不是细胞)连接性的一小部分[43]

在这个阶段,用简单的术语解释单个皮层细胞的功能变得异常困难。事实上,单个细胞的功能可能没有意义,因为各种感知的表征必须分布在整个皮层中的细胞集合中。


颜色视觉适应机制

[edit | edit source]

尽管研究人员一直在试图解释人类视觉系统中颜色信号的处理过程,但重要的是要了解颜色感知不是一个固定的过程。实际上,存在各种动态机制,用于根据观看环境优化视觉反应。与颜色感知特别相关的是暗适应、亮适应和色适应机制。

暗适应
[edit | edit source]

暗适应是指当照明水平降低时发生的视觉灵敏度变化。视觉系统对光照减少的反应是变得更加敏感,从而提高其产生有意义的视觉反应的能力,即使在光照条件不佳的情况下[44]

Dark adaptation. During the first 10 minutes (i.e. to the left of the dotted line), sensitivity recovery is done by the cones. After the first 10 minutes (i.e. to the right of the dotted line), rods outperform the cones. Full sensitivity is recovered after approximately 30 minutes.
图5. 暗适应。在前10分钟内(即虚线左侧),灵敏度恢复由锥体细胞完成。10分钟后(即虚线右侧),杆体细胞的性能优于锥体细胞。大约30分钟后,灵敏度完全恢复。

图 5 显示了从极高亮度水平过渡到完全黑暗后视觉灵敏度的恢复[43]。首先,锥体细胞逐渐变得更加敏感,直到曲线在几分钟后趋于平缓。然后,大约 10 分钟后,视觉灵敏度大致保持恒定。此时,具有较长恢复时间的杆体细胞已经恢复了足够的灵敏度,从而超过锥体细胞,并因此重新控制整体灵敏度。杆体细胞的灵敏度也逐渐提高,直到在大约 30 分钟后变得渐近。换句话说,锥体细胞负责前 10 分钟的灵敏度恢复。之后,杆体细胞超过锥体细胞,并在大约 30 分钟后获得完全的灵敏度。

这只是为了尽可能好地适应黑暗照明条件而产生的几种神经机制之一。一些其他的神经机制包括众所周知的瞳孔反射、光色素的消耗和再生、视网膜细胞的增益控制以及其他高级机制和认知解释等。

光适应
[编辑 | 编辑源代码]

光适应本质上是暗适应的逆过程。事实上,这两个过程的潜在生理机制是相同的。但是,由于其视觉特性不同,因此必须单独考虑它。

Light adaptation. For a given scene, the solid lines represent families of visual response curves at different (relative) energy levels. The dashed line represents the case where we would adapt in order to cover the entire range of illumination, which would yield limited contrast and reduced sensitivity.
图 6. 光适应。对于给定的场景,实线表示在不同(相对)能量水平下视觉响应曲线的系列。虚线表示为了覆盖整个照明范围而进行适应的情况,这将导致对比度有限且灵敏度降低。

当照明水平增加时发生光适应。因此,鉴于有大量可见光可用,视觉系统必须变得不那么敏感,才能产生有用的感知。视觉系统用于产生我们感知的信号具有有限的输出动态范围。然而,现实世界中的照明水平至少覆盖了 10 个数量级。幸运的是,我们很少需要同时查看整个照明范围。

在高光照水平下,适应是通过光色素漂白来实现的。这可以调整感受器中的光子捕获,并保护锥体细胞响应在明亮背景下不饱和。光适应的机制主要发生在视网膜内[45]。事实上,增益变化在很大程度上是锥体细胞特异性的,并且适应信号在不超过单个锥体细胞直径的区域内进行池化[46],[47]。这表明光适应的定位可能早在感受器阶段就开始了。但是,似乎存在不止一个灵敏度缩放位点。一些增益变化非常快,而另一些则需要几秒甚至几分钟才能稳定[48]。通常,光适应大约需要 5 分钟(比暗适应快六倍)。这可能表明了感受器后位点的影响。

图 6 显示了光适应的示例[43]。如果我们使用单个响应函数将大范围的强度映射到视觉系统的输出,那么对于给定场景,我们只有很小的范围可用。很明显,使用这样的响应函数,任何给定场景的感知对比度将受到限制,并且由于信噪比问题,视觉对变化的灵敏度将严重下降。这种情况由虚线表示。另一方面,实线表示视觉响应的系列。这些曲线将任何给定场景中有用的照明范围映射到视觉输出的完整动态范围,从而为每种情况提供最佳的视觉感知。光适应可以被认为是沿照明水平轴滑动视觉响应曲线,直到达到给定观看条件下的最佳水平的过程。


色适应
[编辑 | 编辑源代码]

色适应的一般概念在于三种锥体细胞光谱响应曲线高度的变化。这种调整的出现是因为光适应在每种锥体细胞类型中独立发生。这种假设的一个具体表述被称为冯·克里斯适应。该假设指出,适应响应发生在三种锥体细胞类型中的每一种,并且等同于将其固定的光谱灵敏度乘以一个缩放常数[49]。如果缩放权重(也称为冯·克里斯系数)与每种锥体细胞类型对光的吸收成反比(即,较低的吸收需要较大的系数),那么冯·克里斯缩放将保持每种锥体细胞类别的平均响应恒定。这提供了一种简单而强大的机制,用于保持物体在照明变化时的感知颜色。在多种不同的条件下,冯·克里斯缩放很好地解释了光适应对颜色灵敏度和外观的影响[50],[51]

理解色适应最简单的方法是检查不同类型照明下的白色物体。例如,让我们考虑在日光、荧光灯和白炽灯照明下检查一张纸。日光包含的短波能量比荧光灯多得多,而白炽灯包含的长波能量比荧光灯多得多。但是,尽管照明条件不同,但纸张在所有三种光源下都大致保持其白色外观。这是因为 S 锥体细胞在日光下变得相对不那么敏感(为了补偿额外的短波能量),而 L 锥体细胞在白炽灯照明下变得相对不那么敏感(为了补偿额外的长波能量)[43]

参考文献

[编辑 | 编辑源代码]

绪论 · 听觉系统

  1. a b c d Conway, Bevil R (2009). "颜色视觉、锥体细胞和皮层中的颜色编码". 神经科学家. 15: 274–290.
  2. Russell, Richard 和 Sinha, Pawan} (2007). "现实世界的人脸识别:表面反射特性的重要性". 感知. 36 (9).{{cite journal}}:CS1维护:作者列表有多个名称(link
  3. Gegenfurtner, Karl R 和 Rieger, Jochem (2000). "颜色对自然场景识别的感官和认知贡献". 当代生物学. 10 (13): 805–808.{{cite journal}}:CS1维护:作者列表有多个名称(link
  4. Changizi, Mark A、Zhang, Qiong 和 Shimojo, Shinsuke (2006). "裸露的皮肤、血液和灵长类动物颜色视觉的进化". 生物学快报. 2 (2): 217–221.{{cite journal}}:CS1维护:作者列表有多个名称(link
  5. a b Beretta, Giordano (2000). 理解颜色. 惠普公司.

  6. a b Boynton, Robert M (1988). “颜色视觉”. 心理学年鉴. 39 (1): 69–100.
  7. Grassmann, Hermann (1853). “论颜色混合理论”. 物理年鉴. 165 (5): 69–84.
  8. Konig, Arthur 和 Dieterici, Conrad (1886). “基本感觉及其在光谱中的强度分布”. 普鲁士皇家科学院院刊.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  9. Smith, Vivianne C 和 Pokorny, Joel (1975). “400至500纳米之间中央凹锥体感光色素的光谱敏感性”. 视觉研究. 15 (2): 161–171.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  10. Vos, JJ 和 Walraven, PL (1971). “关于中央凹感受器原色的推导”. 视觉研究. 11 (8): 799–818.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  11. a b c Gegenfurtner, Karl R 和 Kiper, Daniel C (2003). “颜色视觉”. 神经科学. 26 (1): 181.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  12. Kaiser, Peter K 和 Boynton, Robert M (1985). “蓝色机制在波长辨别中的作用”. 视觉研究. 125 (4): 523–529.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  13. Paulus, Walter 和 Kroger-Paulus, Angelika (1983). “视网膜颜色编码的新概念”. 视觉研究. 23 (5): 529–540.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  14. Nerger, Janice L 和 Cicerone, Carol M (1992). “人眼旁中央凹视网膜中L锥体与M锥体的比例”. 视觉研究. 32 (5): 879–888.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  15. Neitz, Jay, Carroll, Joseph, Yamauchi, Yasuki, Neitz, Maureen 和 Williams, David R (2002). “颜色感知是由一种可调节的成人可塑神经机制介导的”. 神经元. 35 (4): 783–792.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  16. Jacobs, Gerald H, Williams, Gary A, Cahill, Hugh 和 Nathans, Jeremy (2007). “表达人类锥体感光色素的小鼠中新型颜色视觉的出现”. 科学. 315 (5819): 1723–1725.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  17. Osorio, D, Ruderman, DL 和 Cronin, TW (1998). “灵长类动物视网膜编码的亮度信号中由红绿锥体采样自然图像引起的误差估计”. JOSA A. 15 (1): 16–22.{{cite journal}}: CS1维护:多位作者:作者列表(链接)
  18. Kersten, Daniel (1987). “自然图像的可预测性和冗余性”. JOSA A. 4 (112): 2395–2400.
  19. Jolliffe, I. T. (2002). 主成分分析. 施普林格出版社.

  20. Buchsbaum, Gershon和Gottschalk, A (1983). “视网膜中的三色视觉、拮抗色编码和最佳颜色信息传递”. 伦敦皇家学会学报。B辑。生物科学. 220 (1218): 89–113.{{cite journal}}: CS1维护:作者列表有多个名称 (链接)
  21. Zaidi, Qasim (1997). “L和M锥体信号的去相关”. JOSA A. 14 (12): 3430–3431.
  22. Ruderman, Daniel L,Cronin, Thomas W和Chiao, Chuan-Chin (1998). “锥体细胞对自然图像的响应统计:对视觉编码的启示”. JOSA A. 15 (8): 2036–2045.{{cite journal}}: CS1维护:作者列表有多个名称 (链接)
  23. Lee, BB,Martin, PR和Valberg, A (1998). “异色闪光光度法在猕猴视网膜神经节细胞中生理基础的证明”. 生理学杂志. 404 (1): 323–347.{{cite journal}}: CS1维护:作者列表有多个名称 (链接)
  24. a b Derrington, Andrew M,Krauskopf, John和Lennie, Peter (1984). “猕猴外侧膝状体核中的色觉机制”. 生理学杂志. 357 (1): 241–265.{{cite journal}}: CS1维护:作者列表有多个名称 (链接)
  25. Shapley, Robert (1990). “视觉敏感性和视网膜皮层平行通路”. 心理学年度评论. 41 (1): 635--658.
  26. Dobkins, Karen R,Thiele, Alex和Albright, Thomas D (2000). “人类和猕猴红绿等亮点的比较:不同物种之间L:M锥体比率的证据”. JOSA A. 17 (3): 545–556.{{cite journal}}: CS1维护:作者列表有多个名称 (链接)
  27. Martin, Paul R,Lee, Barry B,White, Andrew JR,Solomon, Samuel G和Ruttiger, Lukas (2001). “外周灵长类视网膜神经节细胞的色觉敏感性”. 自然. 410 (6831): 933–936.{{cite journal}}: CS1维护:作者列表有多个名称 (链接)
  28. Perry, VH,Oehler, R和Cowey, A (1984). “投射到猕猴背侧外侧膝状体核的视网膜神经节细胞”. 神经科学. 12 (4): 1101--1123. {{cite journal}}: 引用有空的未知参数:|month= (帮助)CS1维护:作者列表有多个名称 (链接)
  29. Casagrande, VA (1994). “通往灵长类动物V1区的第三条平行视觉通路”. 神经科学趋势. 17 (7): 305–310.
  30. Hendry, Stewart HC和Reid, R Clay (2000). “灵长类视觉中的中间神经元通路”. 神经科学年度评论. 23 (1): 127–153.{{cite journal}}: CS1维护:作者列表有多个名称 (链接)
  31. Callaway, Edward M (1998). “猕猴初级视觉皮层的局部回路”. 神经科学年度评论. 21 (1): 47–74.
  32. Conway, Bevil R (2001). “清醒猕猴初级视觉皮层(V-1)中锥体细胞的锥体输入的空间结构”. 神经科学杂志. 21 (8): 2768–2783. {{cite journal}}: 引用有空的未知参数:|month= (帮助)
  33. Horwitz, Gregory D和Albright, Thomas D (2005). “猕猴V1区中彩色线性运动检测器的稀缺性”. 视觉杂志. 5 (6).{{cite journal}}: CS1维护:作者列表有多个名称 (链接)

  34. Danilova, Marina V 和 Mollon, JD (2006). “空间分离颜色的比较”. 视觉研究. 46 (6): 823–836.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  35. Wachtler, Thomas 和 Sejnowski, Terrence J 和 Albright, Thomas D (2003). “清醒猕猴初级视觉皮层中颜色刺激的表征”. 神经元. 37 (4): 681–691.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  36. Solomon, Samuel G 和 Lennie, Peter (2005). “视觉皮层神经元的色度增益控制”. 神经科学杂志. 25 (19): 4779–4792.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  37. Hubel, David H (1995). 眼、脑和视觉. Scientific American Library/Scientific American Books.
  38. Livingstone, Margaret S 和 Hubel, David H (1987). “感知形状、颜色、运动和深度的独立通道的心理物理学证据”. 神经科学杂志. 7 (11): 3416–3468.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  39. Zeki, Semir M (1973). “恒河猴前纹状皮层中的颜色编码”. 脑研究. 53 (2): 422–427.
  40. Conway, Bevil R 和 Tsao, Doris Y (2006). “通过 fMRI 揭示清醒猕猴皮层中的颜色结构”. 大脑皮层. 16 (11): 1604–1613.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  41. Tootell, Roger BH 和 Nelissen, Koen 和 Vanduffel, Wim 和 Orban, Guy A (2004). “在猕猴视觉皮层中寻找颜色‘中心(s)’”. 大脑皮层. 14 (4): 353–363.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  42. Conway, Bevil R 和 Moeller, Sebastian 和 Tsao, Doris Y (2007). “猕猴纹状体外皮层中的专业颜色模块”. 560--573. 56 (3): 560–573.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  43. a b c d Fairchild, Mark D (2013). 颜色外观模型. John Wiley & Sons.
  44. Webster, Michael A (1996). “人类颜色感知及其适应”. 网络:神经系统中的计算. 7 (4): 587–634.
  45. Shapley, Robert 和 Enroth-Cugell, Christina (1984). “视觉适应和视网膜增益控制”. 视网膜研究进展. 3: 263–346.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  46. Chaparro, A 和 Stromeyer III, CF 和 Chen, G 和 Kronauer, RE (1995). “人类视锥细胞似乎在低光照水平下适应:对红绿检测机制的测量”. 视觉研究. 35 (22): 3103–3118.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  47. Macleod, Donald IA 和 Williams, David R 和 Makous, Walter (1992). “由单个视锥细胞馈送的视觉非线性”. 视觉研究. 32 (2): 347–363.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  48. Hayhoe, Mary (1991). 颜色和亮度中的适应机制. Springer.
  49. MacAdam, DAvid L (1970). 颜色科学的来源. 麻省理工学院出版社.
  50. Webster, Michael A 和 Mollon, JD (1995). “对比适应影响的颜色恒常性”. 自然. 373 (6516): 694–698.{{cite journal}}: CS1 maint: 多个名称:作者列表 (链接)
  51. Brainard, David H 和 Wandell, Brian A (1992)。“非对称颜色匹配:颜色外观如何取决于光源”。JOSA A9 (9): 1443–1448。{{cite journal}}: CS1 维护:作者列表有多个名称 (链接)
华夏公益教科书