跳转到内容

跨学科问题 2020-21/智力测试中的证据

来自维基教科书,开放的书籍,开放的世界

智力定义和测试的方式对现代社会中个人的生计有重大影响,因此这个主题一直是争议的来源[1][2][3]

智力是一个从可变方面形成的抽象概念,不同的学科对衡量智力的证据持不同观点。有些人甚至认为智力测试应该停止。然而,它可以成为研究心理发展和评估认知能力的有价值的理论和实践工具[4]。通过整合解决跨学科冲突可以开发出更全面的智力测试方法,这些方法可以用来造福个人和社会[5][6]。测试需要在机器、动物、人类之间通用,因此需要跨学科进行,并且结果需要针对人类进行标准化。[7] 达成对智力证据的共同理解意味着我们将会确定机器何时达到智力水平。

本维基教科书将探讨心理学、计算机科学和人类学/社会学视角中智力测试的证据,目标是突出冲突。

心理学中的智力测试证据

[编辑 | 编辑源代码]
平均值为 100、标准差为 15 的正常 IQ 分布

心理测量学 中,智力的最常用衡量指标是智商 (IQ)。有多种现代智商测试,英语世界中最常见的是韦氏智力量表,针对成人和儿童有不同的版本。大卫·韦克斯勒认为智力是由可以孤立和测量的相互关联的认知能力元素组成的。[8] 该测试的当前版本 WAIS-IV 由以下指标组成:言语理解、知觉推理、工作记忆和处理速度。[9]

智商分数是根据 标准差 计算的,将个人的表现与平均水平进行比较。这些分数是 正态分布 的,其中平均分数是最常见的(平均值为 100,标准差为 15 个智商点)。[10] 因此,智商分数是对智力的估计,而不是直接衡量。智商测试已被证明具有很高的 统计可靠性,其 置信区间 约为 10 个点,其 标准误差 为 3 个点。[11] 尽管由于外部因素(如动机和焦虑)导致个体智商测试表现可能有所不同,从而对有效性产生质疑,但智商分数与工作和学校的表现相关。[12][13] 一些心理学家认为这是智商测试在教育和工作中实际应用中可行的充分证据。[14]

其他心理学家对智商测试持批评态度,韦恩·韦顿指出:“智商测试是对在学术工作中取得良好成绩所需的智力类型的有效衡量。但如果目的是评估更广泛意义上的智力,智商测试的有效性就值得怀疑。” 智商测试可以衡量智力的形式,但更广泛的方面,包括创造力和情商,却没有考虑到。[15] 针对这些批评,有一些替代测试可以用来衡量能力。例如,梅耶-萨洛维-卡鲁索情商测试。[16]

人类学和社会学视角

[编辑 | 编辑源代码]

人类学和社会学理解侧重于个人与更广泛文化和社会之间的互动。由于智力是一个有争议的概念,其定义在不同文化之间和内部都存在差异[17][18],人类学中的人认为,测量智力的测试必须是内在的,即来自被测试者文化内部[19]。由于不同文化之间存在质的差异,有些人认为跨文化进行的量化比较将毫无帮助 [20]。从人类学角度来看,斯滕伯格和考夫曼认为,文化“将他们认为适应那些文化生活要求的认知、社会和行为属性指定为“智力”[21]。同样,一些社会学家认为智力是一种社会建构,其证据是特定社会历史背景的产物,该背景关注社会分层和不平等周围的问题[22]

关于测量智力,那些持人类学和社会学观点的人强调了智力的可塑性[23],以及其他影响特定测试方法表现的外部因素。贝里和欧文强调需要认识到影响智力表现的不同层面的背景,包括生态背景和实验背景[24]。他们的工作表明,认知风格是根据环境需求发展起来的[25]。因此,要求实验背景(测试智力的背景)与个人自己的学习和日常背景保持一致。一个例子来自巴西街头儿童,尽管他们依靠自己的数学技能来经营自己的生意以求生存,但在学校接受测试时,他们在解决相同的数学问题方面表现不佳,因为所呈现的抽象问题脱离了他们的现实世界背景[26]。因此,传统的智商和心理测量测试被认为是有问题的,因为它们基于对智力和认知表现的非情境性的假设,尤其是在用于比较来自不同文化和经济背景的个体时。

计算机科学中的智力测试证据

[编辑 | 编辑源代码]

语言作为证据

模仿游戏源于笛卡尔的思想,即语言在新的和具有挑战性的情况下具有多功能性是智力的首要测试。[27] 审讯员与机器和人类隔开,提出问题。通过回答,机器试图欺骗审讯员,让它以为是人类,而人类试图帮助审讯员猜测。如果机器成功了,它将根据图灵的观点提供证据表明它具有智力。[28] 机器必须模仿人类,假装无法执行复杂的方程式,并伪造看起来很自然的拼写错误。这里的智力证据是适应性,而不是处理复杂性的 g 因素观点。

HAL 项目将对话能力作为智力的证据进行衡量,并为机器分配一个人类成熟度的估计。通过查看词汇量、反应类型和 平均语长 来检查机器的语音以寻找证据。[29]

控制论

以目标为导向的系统(动物和机械系统),系统与环境之间的沟通或对话是其活动的先决条件。[30] 系统在与不断变化的环境交互过程中产生的反应/活动被视为智能的证据。[31] 智能的证据集中在活动和目标行为上,而不是推理上。

通用智能测试

机器通过与环境交互获得奖励,它必须学习环境结构以及哪些动作可以获得奖励,以最大化获得的奖励数量。对应用奥卡姆剃刀进行额外奖励,奥卡姆剃刀是一种直观且智能的方法。[32]

智商

机器完成传统的智商测试很少被认为是智能的证据,这可能从 1963 年人工智能程序通过 WAIS 的几何类比任务开始。

通常结果与人类相当,但与数字补全一样,机器解决问题的方式可能有所不同,这意味着结果具有不同的误差分布。

与之相关的是心理计量 AI,这个领域专注于构建能够解决一系列问题的机器(使用单一测试来评估机器是无用的,因为它可以专门用来解决问题)。[33]

关于什么被认为是智力测试中的证据,仍然存在很多争论。在机器方面,测试重点是实时灵活性和适应性、创造力的证据;尤其是在语言和对话方面。与人类学和社会学方法一样,计算机科学倾向于关注与外部环境的互动。这与智商测试的通用、静态方法背道而驰,智商测试强调在孤立状态下衡量的智能内在特征的证据,而往往忽视了情境。这些学科之间的互动,以及尚未探索的学科,将有助于我们摆脱这种狭隘的智能理解,朝着更实用的理解迈进。

参考文献

[编辑 | 编辑源代码]
  1. Phelps R. 测量智力:事实与谬误。JDBP。2006;27(4): 356
  2. Beeghley L, Butler EW。公共学校在种族隔离之前和之后智力测试带来的后果。SP。1974;21(5): 740-754。
  3. Bartholemew D。测量智力:事实与谬误。美国:剑桥大学出版社;2004。
  4. 第二章:智力测试的应用。RER。1932;5(3):199。
  5. Benson ES。智能智力测试。MoP。2003;34(2): 48。
  6. Sternberg RJ, Grigorenko EL。智力和文化:文化如何塑造了智能的含义及其对幸福科学的意义。PT: BS。2004;359(1449)。
  7. Hernandez-Orallo J, Martinez-Plumed F, Schmid U, Siebers M, Dowe DL。解决智力测试问题的计算机模型:进展与意义。AI。2016;230: 74-107。
  8. Kaplan RM, Saccuzzo DP。心理测试:原理、应用与问题。第 8 版。加州贝尔蒙特:Wadsworth,Cengage 学习;2010。
  9. Pearson Clinical。韦氏成人智力量表® – 第四版英国版 [互联网]。2020 年。[访问日期:2020 年 12 月 2 日];可从:https://www.pearsonclinical.co.uk/Sitedownloads/Productpdfs/wais-4ukclinical8ppfinalweb.pdf
  10. Gottfredson LS。第 1 章:用于驳斥智力测试证据的逻辑谬误。在:Phelps RF,编辑。纠正关于教育和心理测试的谬误。华盛顿特区:美国心理学会;2009 年。
  11. Pearson Clinical。WISC-V 对 Laurie Jones(2015 年 6 月 1 日)的解释性考虑 [互联网]。2020 年。[访问日期:2020 年 12 月 2 日];可从:https://images.pearsonclinical.com/images/assets/wisc-v/WISC-VInterpretiveReportSample-1.pdf
  12. Carlton SG, Gutierrez L。心理变量与韦氏成人智力量表-IV 的表现。AN: 成年人。2017;24(4): 357-363。
  13. Weiten W。心理学:主题与变奏。第 10 版。加州贝尔蒙特:Wadsworth Cengage 学习;2016。
  14. Kaufman AS。智商测试 101。纽约:Springer 出版社;2009。
  15. Weiten W。心理学:主题与变奏。第 10 版。加州贝尔蒙特:Wadsworth Cengage 学习;2016。
  16. Mayer, JD, Salovey P, Caruso DR, Sitarenios G。使用 MSCEIT V2.0 测量情商。E。2003;3: 97-105。
  17. Sternberg RJ。文化与智能。AP。2004;59(5): 325–338。
  18. Sternberg RJ, Grigorenko EL。智力和文化:文化如何塑造了智能的含义及其对幸福科学的意义。PT: BS。2004;359(1449)。
  19. Sternberg RJ。心灵的隐喻:对智能本质的理解。剑桥:剑桥大学出版社;1990。
  20. Sternberg RJ。心灵的隐喻:对智能本质的理解。剑桥:剑桥大学出版社;1990。
  21. Sternberg RJ, Kaufman JC。人类能力。ARP。1998;49: 497。
  22. Squibb PG。智能的概念 – 社会学视角。TSR。1973;21(1): 57-75。
  23. Sternberg RJ, Kaufman JC。人类能力。ARP。1998;49: 497。
  24. Sternberg RJ。心灵的隐喻:对智能本质的理解。剑桥:剑桥大学出版社;1990。
  25. Berry JW, Irvine SH。人类能力在文化背景中的表现。剑桥大学出版社;1988。
  26. Ceci SJ, Hembrooke HA。智力发展的生物生态模型。APA。1995:303-345
  27. 笛卡尔 R。论正确地运用理性和在科学中寻求真理的方法。莱顿:勒内·笛卡尔;1637。
  28. 图灵 A,1950,“计算机器与智能”,Mind,59(236):433–60。
  29. Legg S, Hutter M。机器智能的测试。50 年的人工智能:献给人工智能 50 周年的论文集。柏林,海德堡:施普林格出版社柏林海德堡;2007 年。第 232-242 页。
  30. Pangaro P。控制论 – 定义 [互联网]。2013 年。[访问日期:2020 年 12 月 3 日];可从:https://pangaro.com/definition-cybernetics.html
  31. 与开放大学合作学习:OpenLearn。机器、心灵与计算机:3.2 控制论与符号 AI [互联网]。2017 年 12 月 6 日。[访问日期:2020 年 12 月 3 日];可从:https://www.open.edu/openlearn/science-maths-technology/computing-and-ict/computing/machines-minds-and-computers/content-section-3.2
  32. Legg S, Hutter M。机器智能的测试。50 年的人工智能:献给人工智能 50 周年的论文集。柏林,海德堡:施普林格出版社柏林海德堡;2007 年。第 232-242 页。
  33. Hernandez-Orallo J, Martinez-Plumed F, Schmid U, Siebers M, Dowe DL。解决智力测试问题的计算机模型:进展与意义。AI。2016;230: 74-107。
华夏公益教科书