认知心理学与认知神经科学/情境模型和推理
上一章 | 概述 | 下一章 |
人类认知系统的一个重要功能和特性是能够从文本和语言描述的情境中提取重要信息。这种能力在理解和记忆中起着至关重要的作用。但是,提取信息后,这些信息会发生什么,我们如何表示这些信息,以及我们如何利用这些信息进行推理呢?本章将介绍“情境模型”的概念(van Dijk & Kintsch,1983,“心理模型”:Johnson-Laird,1983),它是对文本内容的心理表征。我们将讨论这些表征可能是什么样子,并展示各种试图从经验上解决这些问题的实验。通过假设情境是由感知符号编码的(Barsalou,1999),情境模型理论涉及到认知哲学、语言学和人工智能的许多方面。在本章的开头,我们将提到为什么情境模型很重要以及我们使用它们的用途。接下来,我们将重点介绍该理论本身,介绍四种主要类型的 信息 - 情境模型组件、它的表征层次,最后是情境模型构建和处理中使用的另外两种基本类型的知识(一般世界知识和参照特定知识)。
情境模型不仅是情境认知理论中的一个核心概念,有助于我们理解情境信息是如何收集的以及新信息是如何整合的,而且还可以解释许多其他现象。根据 van Dijk & Kintsch 的说法,情境模型负责领域专业知识、翻译、多源学习或仅仅通过阅读来完全理解情境等过程。根据该领域大多数研究人员的说法,这些情境模型包含五个维度,我们将在后面解释。当提取关于这些维度之一的新信息时,情境模型会根据新信息进行改变。情境模型的改变越大,读者需要花更多时间来理解包含新信息的情境。如果存在矛盾,例如与模型不符的新信息,读者将无法理解文本,可能需要重新阅读文本的部分内容来构建更好的模型。在几个实验中表明,更容易理解文本,这些文本在文本理解的五个维度中只有很小的变化。还发现,如果重要信息更明确地提及,读者更容易理解文本。因此,一些研究人员写了关于突出重要信息的重要性(见 Zwaan & Radvansky 1998,了解详细列表)。关于情境模型的另一个重要问题是多维性。这里最重要的 问题是,不同的维度是如何相关的,以及它们在构建模型中所占的权重是多少。一些研究人员声称,维度权重会根据所描述的情境而发生变化。介绍这些主张将是本章的最后一部分,旨在向您介绍当前和未来的研究目标。
Rolf A. Zwaan,1962 年 9 月 13 日出生于鹿特丹(荷兰),对这个主题非常重要,因为他进行了最多的研究(总共 92 篇出版物),而且我们的大部分数据都来自他的工作。Zwaan 在乌特勒支大学(荷兰)获得了硕士学位(1986 年)和博士学位(1992 年),均为优等成绩。从那时起,他获得了多个奖项,例如发展型学者奖(佛罗里达州立大学,1999 年)或汉萨高级研究所院士(德国德尔门霍斯特,2003 年),并成为多个专业组织的成员,如心理科学学会、认知科学学会或美国心理学会。自 2007 年以来,他在鹿特丹伊拉斯姆斯大学(荷兰)担任生物学与认知心理学主席。
许多基于语言处理的任务只能通过使用情境模型来解释。所谓的情境模型或心理模型包含五个不同的维度,这些维度指的是不同的来源。为了理解文本或简单的句子,情境模型很有用。此外,该理论可以更好地解释对多个文本和句子的理解和组合。以下列出了我们真正需要情境模型的一些例子。
跨句信息整合不仅仅是理解一组句子。例如
“格哈德·施罗德在一些记者面前。对前德国总理来说,期待新的想法并不稀奇。就像 1971 年的旧时光一样,当时的社民党青年团领导人在民意调查中落后,并谈论变革。”
这个例子只有当读者知道“格哈德·施罗德”、“德国前总理”和“1971 年 Jusos 的领导人” 是同一个人时才有意义。如果我们建立一个情境模型,在这个例子中,“格哈德·施罗德” 是我们的标记。出现的每一个信息都会根据语法和世界知识与这个标记联系起来。第二句话中的定冠词指的是第一句话中的人。这是基于语法知识的。每一个定冠词都表明与之前句子中的人物有关。如果出现不定冠词,我们就需要为新的个体建立一个新的标记。第三句话通过领域知识与标记相连。必须知道“格哈德·施罗德”是 1971 年 Jusos 的领导人。否则,这种联系只能是猜测。我们可以看到,需要一个整合的情境模型才能理解三句话之间的联系。
跨模态理解表现相似性的解释只能通过使用情境模型来完成。如果我们阅读报纸文章、观看电视报道或收听广播报道,我们对相同的信息会产生类似的理解,而这些信息是通过不同的模态传递的。因此,我们会创建信息的或事件的心理表征。这种心理表征并不依赖于模态本身。此外,有经验证据支持这种直觉。Baggett (1979) 发现,观看过短片的学生和听过短片中事件的语音版学生最终产生了结构相似的回忆记录。这两个组的记录存在差异,但差异是由于内容方面造成的。例如,文本版本明确指出一个男孩正在上学的路上,而在电影中,这一点需要推断出来。
情境模型对领域专业知识对理解的影响有深刻的影响。具体来说,这意味着如果一个人 A 的语言技能不如人 B,但他在主题领域的知识更丰富,他就可以胜过人 B。为了证明这种直觉,Schneider 和 Körkel (1989) 做过一项研究。他们比较了关于足球比赛的文本中“专家”和新手的回忆。研究中包括三个不同的年级:三年级、五年级和七年级。该实验中一个重要的例子是,三年级的足球专家胜过了七年级的新手。文本中单元的回忆率为:三年级专家为 54%,七年级新手为 42%。解释很简单:三年级专家建立了一个情境模型,并利用了他们长期记忆中的知识 (Ericsson & Kintsch, 1995)。七年级新手只拥有文本,他们只能通过文本建立情境模型。一些其他的研究也为领域专业知识可能抵消语言能力的理论提供了证据,例如,Fincher-Kiefer, Post, Greene & Voss, 1988 或 Yekovich, Walker, Ogle & Thompson 在 1990 年的研究。
另一个需要情境模型的例子是解释翻译。将句子或文本从一种语言翻译成另一种语言,不仅仅是翻译每个词并构建新的句子结构,直到句子听起来合理为止。现在让我们看一下一个荷兰语句子的例子
现在我们可以得出结论,荷兰语和英语之间的翻译水平不是基于词汇语义层面的,而是基于情境层面的。在这个例子中,“在你没有做完其他事情(另一个动作)之前,不要做某事(动作)”。其他研究也发现,在翻译过程中构建情境模型的能力对翻译技能很重要 (Zwann, Ericsson, Lally and Hill, 1998)。
人们能够从多个文档中学习关于某个领域的知识。这种现象也可以用情境模型来解释。例如,如果我们试图了解关于“冷战”的知识,我们会使用包含不同信息的文档。一个文档中的信息可能与其他文档相似。指称可以是相同的,或者“冷战”中的特殊关系可以通过使用不同的文档来弄清楚。因此,我们在学习和推理中真正做的事情是,将不同文档中的信息整合到一个共同的情境模型中,这个模型对我们所学信息的顺序进行了组织。
我们已经看到,在语言处理的不同任务中需要情境模型,但并非所有语言处理任务都需要情境模型。一个例子是校对。校对员检查每个词是否正确。这种能力不包含构建情境模型的能力。这项任务利用了长期记忆中的资源,其中存储着每个词的正确写法。程序是这样的
这是逐个单词进行的。在语言处理的这项任务中,没有必要创建情境模型。
通常,与我们空间位置更近的物体比更远的物体更相关。因此,人们会期望情境模型也是如此。与这种观点一致的是,理解者在识别表示与主角距离较远的物体(而不是与主角距离较近的物体)的词时反应更慢 (Glenberg, Meyer & Lindem, 1987)。
当理解者对故事背景的空间布局 (例如,建筑物) 有广泛的了解时,他们会根据主角的位置和目标更新他们的表征。他们对主角当前所在的房间或正在前往的房间拥有最快的心理访问权限。例如,如果提到的房间是这些房间中的一个,那么他们更容易说出两个物体是否在同一个房间里,而不是如果它是建筑物中的其他房间 (例如,Morrow, Greenspan, & Bower, 1987)。从直觉上讲,这是完全合理的,因为如果我们处于这种情况下,这些房间与我们相关。
人们对表示人和物体在空间中运动的动词的意义的解释,例如靠近,取决于他们的情境模型。例如,理解者对靠近的意义的解释在拖拉机正在靠近栅栏与老鼠正在靠近栅栏中有所不同。具体而言,当物体较大(拖拉机)时,他们将物体与地标之间的距离解释为更长,而当物体较小(老鼠)时,他们将距离解释为更短。理解者的解释也取决于地标的大小和物体的速度 (Morrow & Clark, 1988)。显然,理解者表现得好像他们真的站在情境中,看着拖拉机或老鼠靠近栅栏。
我们默认假设事件是按时间顺序叙述的,没有任何遗漏。这种假设可能存在,因为这是我们每天体验事件的方式。事件以连续的流的形式发生在我们身上,有时紧密相连,有时并行发生,而且经常部分重叠。然而,语言允许我们偏离时间顺序。例如,我们可以说,“在心理学家提交手稿之前,期刊改变了其政策。”心理学家提交手稿被首先报道,尽管它是两个事件中最后发生的事件。如果人们构建了一个情境模型,这个句子应该比其时间顺序的对应词 (同一个句子,但以“之后”开头) 更难处理。最近的神经科学证据支持了这一预测。事件相关脑电位 (ERP) 测量表明,“之前”句子在 300 毫秒内引起比“之后”句子更大的负电位。这种电位的差异主要位于大脑左侧的前部,表明认知努力更大 (Münte, Schiltz, & Kutas, 1998)。在现实生活中,事件无缝地相互追随。但是,叙述可以有时间上的不连续性,当作者省略与情节无关的事件时。这种时间间隔,通常由几天后之类的短语表示,在叙述中很常见。尽管如此,它们与日常经验背道而驰。因此,时间变化应该导致 (轻微) 的理解过程的破坏。而它们确实如此。介绍时间变化的句子的阅读时间往往比没有介绍时间变化的句子的阅读时间更长 (Zwaan, 1996)。
All other things being equal, events that happened just recently are more accessible to us than events that happened a while ago. Thus, in a situation model, enter should be less accessible after An hour ago, John entered the building than after A moment ago, John entered the building. Recent probe-word recognition experiments support this prediction (e.g., Zwaan, 1996).
当我们与环境互动时,我们倾向于将事件序列解释为因果序列。需要注意的是,就像我们推断主角的目标一样,我们也必须推断因果关系;我们无法直接感知它。Singer 和他的同事(例如 Singer、Halldorson、Lear 和 Andrusiak,1992)研究了读者如何利用他们的世界知识来验证叙述事件之间的因果联系。受试者阅读句子对,例如 1a 然后 1b 或 1a' 然后 1b,然后被呈现类似 1c 的问题。
(1a) Mark 将一桶水倒在篝火上。
(1a’) Mark 将一桶水放在篝火旁。
(1b) 篝火熄灭了。
(1c) 水能灭火吗?
在 1a-1b 序列之后,受试者比在 1a'-1b 序列之后更快地回答 1c。根据 Singer 的说法,速度差异的原因是激活了水能灭火的知识来验证 1a-1b 中描述的事件。但是,由于此知识无法用来验证 1a'-1b,因此当受试者阅读该句子对时,它没有被激活。
我们通常能够通过推断人们的意图性,即他们的目标,来预测他们的未来行为。例如,当我们看到一个男人走向椅子时,我们假设他想坐下,尤其是当他站了很长时间时。因此,我们可能会得出推断“他要坐下了”。Keefe 和 McDaniel(1993)向受试者展示了类似于在经历了 3 小时的辩论后,疲惫的演讲者走到了他的椅子旁 (并坐了下来) 的句子,然后展示探测词(例如,在这种情况下为坐)。当包含关于演讲者坐下的子句时,受试者在命名“坐”上花费的时间与省略该子句时花费的时间大致相同。此外,在这两种情况下,命名时间都明显快于控制条件,在控制条件下,暗示演讲者仍然站着。
理解者很快就能对主角做出推断,这可能是为了构建一个更完整的场景模型。例如,考虑一下受试者阅读完句子电工检查了灯具后会发生什么。如果下一句是她拿出了螺丝刀,那么与下一句是他拿出了螺丝刀相比,他们的阅读速度会变慢。这是因为“她”与电工的刻板印象性别不符,而受试者在阅读第一句话时似乎已经推断出这一点(Carreiras、Garnham、Oakhill 和 Cain,1996)。
Comprehenders also make inferences about the emotional states of characters. For example, if we read a story about Paul, who wants his brother Luke to be good in baseball, the concept of “pride” becomes activated in our mind when we read that Luke receives the Most Valuable Player Award (Gernsbacher, Goldsmith, & Robertson, 1992). Thus, just as in real life, we make inferences about people’s emotions when we comprehend stories.
在语言和文本理解的过程中,新信息需要整合到当前的场景模型中。这是通过处理框架实现的。关于这个过程,有各种理论和见解。它们大多数只模拟场景模型和语言理解的一个或某些方面。
语言理解框架的理论、见解和发展列表
- 互动理解模型 (Kintsch 和 van Dijk,1978)
- 早期计算模型 (Miller, Kintsch, 1980)
- 构建整合模型 (Kintsch, 1988)
- 结构构建框架 (Gernsbacher,1990)
- 容量约束阅读器模型 (Just, Carpenter, 1992)
- 建构主义框架 (Graesser, Singer, Trabasso, 1994)
- 事件索引模型 (Zwaan, Langston, Graesser, 1995)
- 景观模型 (van den Brock, Risden, Fletcher, & Thurlow, 1996)
- 容量约束构建整合模型 (Goldman, Varma, Coté, 1996)
- 沉浸体验者框架 (Zwaan, 2003)
在本节关于场景模型的章节中,我们将讨论几个模型;我们将从一些早期的内容开始,然后转向流行的后期内容。我们将从 70 年代和 80 年代 Kintsch 的工作开始,然后继续讨论基于此工作的后续研究。
该模型已在 80 年代开发;它是许多后期模型的基础,例如 CI 模型,甚至沉浸体验者框架。根据 Kintsch 和 van Dijk (1978) 的说法,文本理解以循环的方式进行。在每个循环中,处理几个命题,这个数量由短期记忆的容量决定,所以是 7 加减 2。在每个循环中,新的命题都与已有的命题相连,因此它们形成了一个连通的层次结构集。
Miller 和 Kintsch 的这个计算模型试图模拟早期的理解理论,根据这些理论做出预测,并将它们与行为研究和实验进行比较。它由几个模块组成。一个是分块程序:它的任务是同时读取一个词,识别它是否是一个命题,并决定是否将其整合。模型的这一部分没有通过计算完成。下一个输入顺序是微观结构一致性程序 (MCP)。MCP 对命题进行排序,并将它们存储在工作记忆一致性图中。工作记忆一致性图的任务是决定在下一个处理循环中哪些命题应该保持活跃状态。所有命题都存储在长期记忆一致性图中,它决定哪些命题应该被传回工作记忆中,或者它可以构建一个具有不同上位节点的全新工作记忆图。这个计算模型的问题是它的性能很低。但它仍然导致了进一步的研究,试图克服它的缺点。
事件索引模型 最初由 Zwaan、Langston 和 Graesser (1995) 提出。它对理解中传入信息的处理方式以及它如何在长期记忆中被表示做出了一些断言。
根据事件索引模型,所有传入的动作事件都分解为五个索引。五个索引与五个情景维度相同,尽管 Zwaan & Radvasnky(1998) 声称可能存在更多维度。这些可能会在未来的研究中被发现。该模型的一个基本点是将新事件整合到当前模型中的处理时间。如果新传入事件与先前事件共享索引,则更易于将其整合。新的事件越连续,越容易被整合到新的场景模型中。Zwaan & Radvanksy (1998) 做出的这一预测得到了一些先前研究的支持 (Zwaan、Magliano 和 Graesser,1995)。事件索引模型 的另一个重要点是长期记忆中的表示。Zwaan & Radvasnky (1998) 预测这种表示是一个节点网络,这些节点对事件进行编码。节点通过情景链接相互连接,这些情景链接根据它们共享的索引进行区分。这种连接不仅对两个节点是否共享索引进行编码,还通过其强度对共享索引的数量进行编码。这个第二点已经暗示了事件索引模型 的不足。它没有包含几个东西。例如,它没有对事件的时间顺序或因果关系的方向进行编码。事件索引模型 最大的缺点是它显然将不同的维度视为不同的实体,尽管它们可能相互作用。
Zwaan & Radvansky (1998) 对事件索引模型进行了一些更新,提出了新模型,将处理的信息分成三种类型:情境框架、情境关系和情境内容。情境框架将情境置于时空背景中,其构建是强制性的。如果没有提供任何信息,则框架可能由从先验世界知识中检索到的标准值构建,或者实例化一个空变量。情境关系基于五个情境维度,这些维度通过事件索引模型进行分析。这种情境信息不包括情境框架中给出的基本信息,而是网络中不同实体或节点之间的关系。与情境框架不同,情境关系不是强制性的。如果没有提供信息,或者实体之间没有可能的推理,那么就没有关系。此外,还有一个索引用于描述不同关系的重要性。这种重要性包括信息对理解情境的必要性、信息在未提及的情况下推断的难易程度以及信息稍后被记住的难易程度。该理论还区分了功能关系和非功能关系 (Carlson-Radvansky & Radvansky, 1996; Garrod & Sanford, 1989)。功能关系描述了不同实体之间的相互作用,而非功能关系是描述非相互作用实体之间的关系。情境内容包含情境中的实体,如主角、物体及其属性。这些实体只有在对理解情境必要时才会被显式地整合到情景模型中,就像情境关系一样。然而,核心和最重要的实体及其属性又是强制性的。为了降低处理时间,建议只用类似指针的东西来表示非必要信息,以便在需要时可以检索到这些信息。
沉浸体验框架
[edit | edit source]沉浸体验框架 (IEF) 基于先前的处理框架模型 (见上文详细列表),但尝试包含其他一些研究发现。例如,研究发现,在理解过程中,大脑区域被激活,这些区域非常接近甚至与在感知或行动词意义时活跃的大脑区域重叠 (Isenberg 等人,2000; Martin & Chao, 2001; Pulvermüller, 1999, 2002)。在理解过程中,还会对物体的形状和方向进行视觉呈现 (Dahan & Tanenhaus, 2002; Stanfield & Zwaan, 2002; Zwaan 等人,2002; Zwaan & Yaxley, in press a, b)。视觉空间信息为句子处理提供线索 (Boroditsky, 2000)。这些视觉呈现可能会干扰理解 (Fincher-Kiefer, 2001)。来自 (Glenberg, Meyer & Lindem, 1987; Kaup & Zwaan, in press; Morrow *等*,1987; Horton & Rapp, in press; Trabasso & Suh, 1993; Zwaan 等人,2000) 的研究结果表明,作为情境和文本一部分的信息,在读者脑海中的活跃度高于未包含的信息。第四个研究发现是,人们在理解过程中会以与描述的情境一致的方式移动他们的眼睛和手 (Glenberg & Kaschak, in press; Klatzky 等人,1989; Spivey 等人,2000)。
沉浸体验框架的核心思想是,词语激活了与它们所指代的事物的体验。例如,"一只在天空中的鹰" 会激活一种视觉体验,即一只展开翅膀的鹰,而 "一只在巢穴里的鹰" 会激活另一种视觉体验。根据 Zwaan (2003) 的说法,IEF 应该被视为一个用于对语言理解进行预测的引擎。这些预测被建议用于进一步研究。
根据 IEF,语言理解过程包括三个组成部分:激活、构建和整合。每个组件都在不同的层面上运作。激活在世界层面运作,构建负责子句层面,而整合在话语层面运作。尽管 IEF 与早期的语言理解模型有很多共同点,但在一些主要方面有所不同。例如,它表明语言理解涉及行动和感知表征,而不是非模态命题 (Zwaan, 2003)。
语言和文本理解中的表征层次
[edit | edit source]许多理论试图用不同的表征来解释情景模型或所谓的思维模型。几种关于表征的理论处理了从文本到情景模型本身的理解过程。包含或需要的层次有多少,情景模型是如何构建的,它是否像
句子 → 情景模型
一样一次完成,还是需要经过中间层次才能构建模型?以下展示了三种不同的表征,试图解释文本构建情景模型的过程。
命题表征
[edit | edit source]命题表征认为,一个句子将以另一种方式结构化,然后存储起来。包含的信息不会丢失。我们来看一个简单的句子
“乔治爱莎莉”,命题表征是 [LOVES(GEORGE, SALLY)]
很明显,命题表征很容易创建,信息仍然可用。
三层表征
[edit | edit source]该理论认为,存在三个层次的表征:表面形式、文本基础和情景模型。在这个例子中,句子 "青蛙吃了虫子" 已经是表面形式。我们自然会创建语义关系来理解句子(图中的语义树)。下一层是 "文本基础"。[EAT(FROG, BUG)] 是命题表征,*文本基础* 接近于这种表征,只不过它更具有空间性。最后,情景模型由 "文本基础" 表征构建。我们可以看到,情景模型不包含任何文本。它只是句子本身信息的思维图像。
两层表征
[edit | edit source]该理论类似于 "三层表征" 理论,但 "文本基础" 层级被省略了。该理论本身声称,情景模型是由句子本身创建的,不需要 "文本基础" 层级。
还存在其他一些情景模型理论,它们指向体验。因此,不仅文本理解是通过情景模型完成的,通过直接体验进行的学习也是由情景模型处理的。
KIWi 模型
[edit | edit source]一个被称为 KIWi 模型的统一模型试图解释文本表征和直接体验如何与情景模型相互作用。此外,领域知识也被整合进来。领域知识通过在不同任务中形成情景模型来使用,例如简单的句子理解 (章节:为什么我们需要情景模型)。KIWi 模型表明,"文本表征 → 情景模型" 之间以及 "感官编码 → 情景模型" 之间存在永久的交互作用。这些交互作用支持了思维模型持续更新的理论。
推理
[edit | edit source]推理用于构建包含有限信息的复杂情景模型。例如:1973 年,John Bransford 和 Marcia Johnson 做了一个记忆实验,他们让两组人阅读同一个句子的变体。
第一组阅读的文本是 "约翰试图修理鸟屋。他正在用锤子敲钉子,这时他的父亲出来看他干活。"
第二组阅读的文本是 "约翰试图修理鸟屋。他正在寻找钉子,这时他的父亲出来看他干活。"
阅读后,一些包含单词 "锤子" 的测试语句被呈现给参与者,而 "锤子" 这个词并没有出现在原始句子中,例如: "约翰正在用锤子修理鸟屋。他正在寻找钉子,这时他的父亲出来看他干活。" 第一组的参与者说他们看到了 57% 的测试语句,而第二组的参与者只看到了 20% 的测试语句。
可以看出,在第一组中,参与者倾向于认为自己看到了单词 "锤子"。这组的参与者推断出,约翰是用锤子敲钉子的。这个记忆影响测试很好地说明了推理的概念,以及推理如何用于完成情景模型。
在阅读文本时,推断会创造出文本中没有明确说明的信息;因此,这是一个创造性的过程。对于一般的文本理解来说,推断非常重要,因为文本无法包含理解故事意义所需的所有信息。文本通常省略了被称为“世界知识”的信息。世界知识是指大多数人共享的关于情境、人物或事物的知识,因此不需要明确说明。每个人都应该能够推断出这种信息,例如,我们通常使用锤子来敲钉子。如果文本必须包含所有与之相关的的信息,那么写一篇文本将是不可能的;如果不存在推断这样的东西,或者如果它没有被我们的大脑自动完成。
有许多不同类型的推断
回指推断
[edit | edit source]这种推断通常将一个句子中的物体或人物与另一个句子中的物体或人物连接起来。因此,它负责连接跨句子的信息。例如,在“约翰敲了钉子。他为自己的击打感到自豪”中,我们直接推断出“他”和“他的”与“约翰”有关。我们通常很容易进行这种推断。但是,也有一些句子,其中更多的人物和其他与他们相关的词语被混淆在一起,人们一开始就难以理解故事。这通常被认为是糟糕的写作风格。
工具推断
[edit | edit source]这种推断是关于文本中使用的工具和方法,例如上面的例子中的锤子。或者,例如,如果你读到有人飞往纽约,你不会推断出这个人制造了一个龙飞器,然后从悬崖上跳下来,而是推断出他或她使用了飞机,因为文本中没有提到其他方式,而飞机是飞往纽约最常见的交通工具。如果关于工具、仪器和方法没有具体的信息,我们会从我们的“一般世界知识”中获取这些信息。
因果推断
[edit | edit source]因果推断是指文本中一个事件导致了另一个事件的结论,例如,“他敲了钉子,所以他的手指疼痛”。第一个句子说明了第二个句子中描述的情况产生的原因。在“他敲了钉子,所以他父亲跑了”这样的例子中,很难得出因果推断,尽管人们可以根据一些想象力来进行推断。
因果推断在文本元素之间创建因果关系。这些关系被分为“局部连接”和“全局连接”。局部连接是在 1 到 3 个句子的范围内进行的。这取决于工作记忆容量和阅读时注意力集中的因素。全局连接是在一个句子中的信息与迄今为止收集到的关于整个文本的背景信息之间建立的。当故事“不一致”时,因果推断可能会出现问题。例如,素食者吃牛排是不一致的。关于因果推断的一个有趣的事实(Goldstein,2005)是,我们在这里进行的那些一开始不容易看到的推断更容易被记住。这可能是因为它们在进行推断时需要更高的精神处理能力。因此,这种“不太容易”的推断似乎以某种方式被标记,因此更容易记住它。
预测性/前向推断
[edit | edit source]预测性/前向推断使用读者的“一般世界知识”来构建他对故事中当前正在发生的事情的结果的预测,并将其纳入情境模型。
将推断整合到情境模型中
[edit | edit source]模型如何进入推理过程的问题在认知心理学和人工智能这两个学科中极具争议。人工智能对心理过程有了深刻的洞察,并且这两个学科相互交叉,构成了认知科学的两个主要基础。尽管它们有许多共同点,但这些论点在很大程度上是相互独立的。
Johnson-Laird(1983)区分了三种推理理论,推断在其中扮演着重要的角色。第一类针对逻辑演算,并在许多形式系统中得到实现。编程语言 Prolog 源于这种处理推理的方式,在心理学中,许多理论假设了形式推理规则,即“心理逻辑”。这些规则以纯粹的句法方式工作,因此是“与上下文无关的”,对内容的上下文视而不见。一个简单的例子说明了这种类型的理论的问题
If patients have cystitis, then they are given penicillin.
以及逻辑结论
If patients have cystitis and are allergic to penicillin, then they are given penicillin
这在逻辑上是正确的,但似乎违背了我们对逻辑的常识。
第二类理论假设内容特定的推理规则。它们的起源在于编程语言和产生式系统。它们使用类似“如果 x 是 a,那么 x 是 b”的形式。如果要证明 x 是 b,证明 x 是这个论证的子目标。Johnson-Laird 和 Wason 讨论了将推理的心理理论建立在内容特定规则上的想法,并且已经提出了各种类型的这种理论。一个相关的想法是,推理取决于连接主义框架内特定例子的积累,其中推理和回忆之间的区别变得模糊。
第三类理论基于心理模型,不使用任何推理规则。建立对听到或读到的东西的心理模型的过程。模型处于不断更新的状态。建立的模型将配备新信息的新的特征,只要没有生成与该模型冲突的信息。如果是这种情况,模型通常会重建,以便生成冲突的信息适合新的模型。
当前研究的重要主题
[edit | edit source]语言线索与世界知识
[edit | edit source]根据许多研究人员的说法,语言是关于如何构建所代表情境的情境模型的一组处理指令(Gernsbacher,1990;Givon,1992;Kintsch,1992;Zwaan & Radvansky,1998)。如前所述,读者使用词汇线索和信息来连接不同的情境维度,并将它们整合到模型中。这里另一个重要点是先前的世界知识。世界知识也影响了情境模型中不同信息之间的关系。因此,语言线索和世界知识之间的关系是情境模型领域中当前和未来研究的重要主题。
多维性
[edit | edit source]情境模型领域中当前研究的另一个重要方面是模型的多维性。这里的主要方面是如何将不同的维度联系起来,它们如何影响和相互作用。这里的问题也是它们是否真的相互作用以及哪些相互作用。该领域的大多数研究只关注一个或几个情境维度。
参考文献
[edit | edit source]Ashwin Ram 等人。(1999)理解语言理解——第 5 章。
Baggett,P.(1979)。电影和文本中结构等效的故事,以及媒体对回忆的影响。言语学习与言语行为杂志,18,333-356。
Bertram F. Malle 等人。(2001)意图和意向性——第 9 章。
Boroditsky,L.(2000)。隐喻结构:通过空间隐喻理解时间。认知,75,1-28。
Carlson-Radvansky,L. A. 和 Radvansky,G. A.(1996)。功能关系对空间术语选择的影响。心理科学,7,56-60。
Carreiras,M. 等人。(1996)。在构建心理模型中使用刻板印象的性别信息:来自英语和西班牙语的证据。实验心理学季刊,49A,639-663。
Dahan,D. 和 Tanenhaus,M.K.(2002)。在口语词识别过程中激活概念表征。心理学会摘要,7,14。
Ericsson,K. A. 和 Kintsch,W.(1995)。长期工作记忆。心理评论,102,211-245。
Farah,M. J. 和 McClelland,J. L.(1991)。语义记忆障碍的计算模型:模态特异性和新出现的类别特异性。实验心理学杂志:普通,210,339-357。
Fincher-Kiefer(2001)。情境模型的知觉成分。记忆与认知,29,336-343。
Fincher-Kiefer,R. 等人。(1988)。关于先验知识和任务需求在文本处理中的作用。记忆与语言杂志,27,416-428。
Garrod,S. C. 和 Sanford,A. J.(1989)。话语模型作为语言和空间世界之间的接口。语义学杂志,6,147-160。
Gernsbacher,M.A.(1990),语言理解作为结构构建。新泽西州希尔斯代尔:劳特利奇。
Glenberg,A. M. 和 Kaschak,M. P.(2002)。将语言扎根于行动。心理公告与评论,9,558-565。
Glenberg,A. M. 等人。(1987)心理模型有助于文本理解过程中的前台化。记忆与语言杂志 26:69-83。
Givon,T.(1992),指称一致性的语法作为心理处理指令,语言学,30,5-55。
Goldman,S.R. 等人(1996)。扩展容量约束的结构集成:走向“更智能”和灵活的文本理解模型。文本理解模型(第 73-113 页)。
Goldstein,E.Bruce,认知心理学,连接心灵、研究和日常生活体验 (2005) - ISBN 0-534-57732-6.
Graesser,A. C.,Singer,M. 和 Trabasso,T.(1994),在叙述文本理解过程中构建推断。心理评论,101,371-395。
Holland,John H. 等人(1986)归纳。
Horton,W.S.,Rapp,D.N.(即将出版)。遮挡和叙述理解中信息的易获得性。心理科学通报与评论。
Isenberg,N. 等人(1999)。语言威胁激活人类杏仁核。美国国家科学院院刊,96,10456-10459。
Johnson-Laird,P. N.(1983)。心理模型:走向语言、推理和意识的认知科学。马萨诸塞州剑桥:哈佛大学出版社。
John R. Koza 等人(1996)遗传编程。
Just,M. A. 和 Carpenter,P. A.(1992)。理解的容量假设:工作记忆中的个体差异。心理评论,99,122-149。
Kaup,B. 和 Zwaan,R.A.(即将出版)。否定和情境存在对文本信息易获得性的影响。实验心理学杂志:学习、记忆和认知。
Keefe,D. E. 和 McDaniel,M. A.(1993)。预测推断的时间过程和持久性。记忆与语言杂志,32,446-463。
Kintsch,W.(1988),知识在话语理解中的作用:一个建构-整合模型,心理评论,95,163-182。
Kintsch,W. 和 van Dijk,T. A.(1978),走向文本理解和生成模型,心理评论,85,363-394。
Kintsch,W.(1992),读者如何为故事构建情境模型:句法线索和因果推断的作用。在 A. E Healy,S. M. Kosslyn 和 R. M. Shiffrin(编辑)中,从学习过程到认知过程。纪念 William K. Estes 的论文集(第 2 卷,第 261-278 页)。
Klatzky,R.L. 等人(1989)。你能挤压西红柿吗?运动表征在语义敏感性判断中的作用。记忆与语言杂志,28,56-77。
Martin,A. 和 Chao,L. L.(2001)。语义记忆和大脑:结构和过程。神经生物学最新观点,11,194-201。
McRae,K. 等人(1997)。关于单词意义特征表征的性质和范围。实验心理学杂志:一般,126,99-130。
Mehler,Jacques 和 Franck,Susana。(1995)认知上的认知 - 第 9 章。
Miceli,G. 等人(2001)。颜色与形状和功能知识的分离。自然神经科学,4,662-667。
Morrow,D. 等人(1987)。可获得性和叙述理解中的情境模型。记忆与语言杂志,26,165-187。
Pulvermüller,F.(1999)。大脑语言中的单词。行为与脑科学,22,253-270。
Pulvermüller,F.(2002)。从离散神经元集合到串行顺序:从大脑视角看语言机制。神经生物学进展,67,85-111。
Radvansky,G. A. 和 Zwaan,R.A.(1998)。情境模型。
Schmalhofer,F.,MacDaniel,D. Keefe(2002)。预测和桥接推断的统一模型。
Schneider,W. 和 Körkel,J.(1989)。知识库和文本回忆:来自短期纵向研究的证据。当代教育心理学,14,382-393。
Singer,M. 等人(1992)。因果桥接推断的验证。记忆与语言杂志,31,507-524。
Spivey,M.J. 等人(2000)。理解口语场景描述时的眼动。第二十二届认知科学学会年会论文集(第 487-492 页)。
Stanfield,R.A. 和 Zwaan,R.A.(2001)。来自语言语境的隐含方向对图片识别的影响。心理科学,12,153-156。
Talmy,Leonard,(2000) 走向认知语义学 - 第 1 卷 - 第 1 章
van den Broek,P. 等人(1996)。阅读的“景观”视角:波动的激活模式和记忆表征的构建。在 B. K. Britton 和 A. C. Graesser(编辑)中,文本理解模型(第 165-187 页)。
Van Dijk,T. A. 和 W. Kintsch。(1983)。话语理解策略。
Yekovich,F.R. 等人(1990)。领域知识对低能力个体推断的影响。在 A. C. Graesser 和 G. H. Bower(编辑)中,学习与动机心理学(第 25 卷,第 175-196 页)。纽约:学术出版社。
Zwaan,R.A.(1996)。处理叙述时间转换。实验心理学杂志:学习、记忆和认知,22,1196-1207。
Zwaan,R.A.(2003),沉浸式体验者:走向语言理解的具身理论。B.H. Ross(编辑)学习与动机心理学,第 44 卷。纽约:学术出版社。
Zwaan,R. A. 等人(1998)。翻译过程中的情境模型构建。正在准备的手稿,佛罗里达州立大学。
Zwaan,R. A. 等人(1995)。叙述理解中情境模型构建的维度:事件索引模型。心理科学,6,292-297。
Zwaan,R. A. 等人(1995)。叙述理解中情境模型构建的维度。实验心理学杂志。“学习、记忆和认知,21,386-397。
Zwaan,R. A.,Radvansky(1998),语言理解和记忆中的情境模型。在心理科学通报,第 123 卷,第 2 号,第 162-185 页。
Zwaan,R.A. 等人(2002)。语言理解者是否会例行公事地表征物体的形状?心理科学,13,168-171。
Zwaan,R.A. 和 Yaxley,R.H.(a)。空间图像影响语义相关性判断。心理科学通报与评论。
Zwaan,R.A. 和 Yaxley,R.H.(b)。语义相关性判断中的半球差异。认知。