跳转到内容

当代教育心理学/第 10 章:教师制作的评估策略/建构式反应项目

来自维基教科书,开放书籍,开放世界

正式评估有时也包括建构式反应项目,其中要求学生回忆信息并创建答案,而不仅仅是识别答案是否正确。建构式反应项目可用于评估各种知识,但这里我们仅讨论两种主要类型:完形填空(或简答简短回答)和扩展式回答。

完形填空和简答题

[编辑 | 编辑源代码]

完形填空和简答题可以通过一个词、短语、数字或符号来回答。这些项目本质上只在问题是陈述还是疑问句方面有所不同。例如

  • 完形填空:美国第一个交通信号灯是由……………发明的。
  • 简答题:谁发明了美国第一个交通信号灯?

完形填空或简答题经常用在数学考试中。例如

3 + 10 = …………..?
如果 x = 6,那么 x(x-1) =……….
在以下图形上画出对称轴...

这类项目的最大优势是易于构建。然而,除了在数学中的应用外,它们不适合衡量复杂的学习成果,而且评分往往很困难。完形填空和简答题考试有时被称为客观,因为它们旨在只有一个正确答案,从而减少评分的变异性。然而,除非问题措辞非常谨慎,否则往往会有多种正确答案。例如,考虑以下项目

  • 林肯总统出生在哪里?....................

教师可能期望答案是“在木屋里”,但其他正确答案还有“在沉没泉农场”、“在哈丁县”或“在肯塔基州”。这些项目的常见错误在表格 10 – 4中进行了总结。

扩展式回答

[编辑 | 编辑源代码]

扩展式回答项目在许多内容领域中都有使用,答案的长度可能从一段话到几页不等。要求更长答案的问题通常被称为论述题。扩展式回答项目有几个优点,其中最重要的一个是可以适应衡量复杂的学习成果。由于这些项目还要求学生写作,因此它们也为教师提供了一种评估写作技能的方法。一个经常被引用的优点是它们的构建容易;然而,精心措辞的、与学习成果相关的以及评估复杂学习的项目很难设计。结构良好的项目会以一种清晰的方式表达问题,使学生的任务明确。这通常涉及提供提示或计划笔记。在下面的第一个例子中,实际的问题不仅因为措辞清晰,还因为格式清晰(即,它被放在一个框中)。在第二个和第三个例子中,提供了计划笔记

示例 1:三年级数学[1]
一家书店的老板给学校送了 14 本书。校长将把相同数量的书分给三个教室,其余的书将送给学校图书馆。还剩下多少本书?
在下面的空间和下一页上展示你的所有工作。用文字解释你是如何找到答案的。说明你为什么采取了这些步骤来解决问题。
示例 2:五年级科学:草总是更绿[2]
何塞和玛丽亚注意到,在他们家附近的三个不同类型的土壤中,发现了黑土、沙子和粘土。他们决定研究这个问题,“草坪下面的土壤类型(黑土、沙子和粘土)如何影响草的高度?”
计划一项调查,以回答他们的新问题。在你的计划中,务必包括
  • 对调查结果的预测
  • 进行调查所需的材料
  • 程序包括
  • 进行调查的逻辑步骤
  • 一个保持不变的变量(控制的)
  • 一个被改变的变量(操纵的)
  • 任何正在测量和记录的变量
  • 测量和记录的频率
示例 3:九年级至十一年级英语:写作提示[3]
有些人认为学校应该教学生如何做饭。另一些人则认为,做饭应该在家里学习。你认为呢?解释你为什么这样想。
计划笔记:选择一个
  • 我认为学校应该教学生如何做饭
  • 我认为做饭应该在家里学习
  • 我认为做饭应该在……………………………..学习,因为………

扩展式回答项目的主要缺点是评分的可靠性较差。不仅不同的教师对同一个答案有不同的评分,而且同一个教师也可能在不同的场合对同一个答案有不同的评分。可以通过各种步骤来提高评分的可靠性和效度

  1. 教师首先应该写出模型答案的大纲。这有助于明确学生应该包括什么。
  2. 应该阅读答案的样本。这有助于确定学生的水平以及问题是否导致了任何常见的误解。
  3. 教师必须决定如何处理包含的无关信息(例如,忽略它还是对学生进行处罚),以及如何评估语法和拼写等机械错误。
  4. 应该使用评分或评分标准。在评分中,答案的组成部分会被分配分数。例如,如果学生被问到
高温的性质、症状和风险因素是什么?
评分指南
定义(性质)2 分
症状(每个 1 分)5 分
风险因素(每个 1 分)5 分
写作 3 分

该系统为评估提供了指导,并有助于保持一致性,但评分系统往往会导致教师关注事实(例如,列举风险因素),而不是更高层次的思维,如果教师的目标包括更高层次的思维,则可能会破坏评估的效度。更好的方法是使用评分标准来描述每个级别答案或表现的质量。

评分标准

[编辑 | 编辑源代码]

评分标准可以是整体式或分析式。在整体式评分标准中,对表现进行了总体描述,并获得了一个总分。来自洛杉矶联合学区的二年级语言艺术的例子将答案分为四个等级:不熟练、部分熟练、熟练和高级(见表格 10–5)。

分析式评分标准对各种特性的学生表现水平进行描述。例如,西北地区教育实验室(NWREL)制定的评估写作的六项特性为:[4]

  • 观点和内容
  • 组织
  • 声音
  • 词语选择
  • 句子流畅性
  • 规范

整体式评分标准的优点是比分析式评分标准开发速度更快。它们的使用速度也更快,因为只有一个维度需要检查。然而,它们没有为学生提供有关答案哪些方面很强以及哪些方面需要改进的反馈。这意味着它们对促进学习的评估帮助不大。评分标准的一个重要用途是将它们用作教学工具,并在评估前提供给学生,以便他们了解期望的知识和技能。

教师可以通过在教学过程中向学生提供评分标准、提供多个答案,并根据评分标准分析这些答案,将评分标准用作教学的一部分。例如,使用准确的术语是表格 10-6中科学评分标准的一个维度。小学科学教师可以讨论为什么在学习科学时使用准确的术语很重要,提供不准确和准确的术语示例,向学生提供评分标准的这一部分,分发一些学生答案示例(可能来自以前的学生),然后讨论如何根据评分标准对这些答案进行分类。如果教师采取以下措施,促进学习的评估策略应该会更有效

  1. 强调向学生说明使用准确的术语在学习科学时为什么很重要,而不是如何获得考试好成绩(我们在本章后面关于动机的部分中将对此进行更详细的说明);
  2. 提供一个示例答案,以便学生能够看到模型;以及
  3. 强调目标是学生在这项技能上的提高,而不是对学生进行排名。

(返回第 10 章…)

参考文献

[编辑 | 编辑源代码]
  1. 伊利诺伊州标准成就测试,2006 年;http://www.isbe.state.il.us/assessment/isat.htm)
  2. 华盛顿州 2004 年学生学习评估 http://www.k12.wa.us/assessment/WASL/default.aspx
  3. 伊利诺伊州英语年度增长衡量指标 http://www.isbe.state.il.us/assessment/image.htm
  4. http://www.nwrel.org/assessment/toolkit98/traits/index.html
华夏公益教科书