当代教育心理学/第 10 章:教师制作的评估策略/表现评估
在表现评估中,学生完成特定任务,而教师观察过程或程序(例如,实验中的数据收集)以及产品(例如,完成的报告)(Popham,2005;Stiggens,2005)。[1][2]学生在表现评估中完成的任务并不简单(与选择题相比),可能包括以下内容
- 演奏乐器
- 运动技能
- 艺术创作
- 用外语交谈
- 参与关于政治问题的辩论
- 进行科学实验
- 修理机器
- 撰写学期论文
- 使用互动技能一起玩耍
这些例子都涉及复杂的技能,但表明“表现评估”一词以多种方式使用。例如,教师可能不会观察所有过程(例如,她看到草稿论文,但最终产品是在课外时间写的);因此,作文测试通常被认为是表现评估的例子(Airasian,2000)。[3]此外,在一些表现评估中,可能没有明确的产品(例如,表现可能是小组互动技能)。
两个相关的术语,“替代评估”和“真实评估”,有时被用来代替表现评估,但它们有不同的含义。[4]替代评估是指不是纸笔测试的任务,虽然许多表现评估不是纸笔测试,但有些是(例如,撰写学期论文、作文测试)。真实评估用于描述学生完成的与“现实世界”中类似的任务。课堂任务的真实程度各不相同。例如,对于在芝加哥高中教授的日语课程,在东京用日语交谈非常真实——但只有在出国留学项目或去日本旅行时才有可能。在芝加哥与以日语为母语的人用日语交谈也是非常真实的,在课堂上与老师用日语交谈也相当真实。匹配英语和日语单词的测试的真实程度要低得多。在语言艺术课程中,写信(给编辑)或给校长写备忘录非常真实,因为信件和备忘录是常见的办公用品。然而,写一篇五段式论文并不那么真实,因为这种论文在工作中并不使用。然而,一篇五段式论文是一项复杂的任务,通常被归类为表现评估。
表现评估有几个优点。
- 重点在于复杂的学习成果,这些成果通常无法用其他方法衡量。
- 表现评估通常评估过程或程序以及产品。例如,教师可以观察学生是否使用适当的工具和程序修理机器,以及机器在修理后是否能正常工作。
- 设计良好的表现评估可以清晰地向学生传达教学目标和有意义的学习。例如,如果五年级美术课的主题是透视,表现评估可以是绘制一个展现透视的城市场景。[5]这种评估是有意义的,并且清楚地传达了学习目标。这种表现评估是一个很好的教学活动,并且具有良好的内容效度——这是设计良好的表现评估的常见特点。
表现评估的一个主要缺点是,它通常非常耗费学生和教师的时间。这意味着收集到的评估数量会更少,因此如果评估没有精心设计,评估的学习目标就会更少——这可能会降低内容效度。州课程指南可以帮助确定表现评估中应该包含什么。例如,埃里克是田纳西州一所高中的舞蹈老师,他了解到州标准指出,最高级的舞蹈学生应该能够通过以下方式展示表演技术技能的一致性和清晰度:[6]
- 以各种节拍和风格为背景音乐表演复杂的动作组合。
- 在广泛的动态范围内表演组合和变化。
- 通过自我评估展示表演动作组合的进步。
- 根据给定的标准评价现场或录制的舞蹈作品。
埃里克为他的 11 年级现代舞课程设计了以下表演任务。学生将以 4-6 人一组的形式表演至少 5 分钟长的舞蹈。选择的舞蹈应该多方面,以便所有舞者都能展示技术技能、复杂动作和动态范围(项目 1-2)。学生将录制排练视频,并记录他们通过自我评估进行的改进(项目 3)。每组将在课堂上观看并评论另一组的最终表演(项目 4)。埃里克需要为这项表现评估中的大部分步骤提供支架。这些小组可能需要在以下方面获得指导:选择允许所有舞者展示适当技能的舞蹈;建设性地评价自己的表演;有效地协作,以及应用标准评价舞蹈。
表现评估的另一个缺点是,它们难以可靠地评估,这会导致评估不准确和不公平。与任何建构式反应评估一样,评分标准非常重要。设计用于评估完成产品的整体评分标准和分析评分标准的示例见表 10-5和表 10-6。设计用于评估小组互动过程的评分标准见表 10-7。该评分标准是为初中科学课程设计的,但也可以在其他学科评估小组过程时使用。在一些表现评估中,应该使用多个评分标准。在上面的舞蹈表演示例中,埃里克应该为表演技能、基于自我评估的改进、团队合作以及对其他小组的评价制定评分标准。由于设计良好的表现评估显然很复杂,因此以下方法可能会有所帮助
- 创建要求学生使用复杂认知技能的表现评估。有时教师会设计一些有趣且学生喜欢的评估,但这些评估不要求学生使用导致重大学习的高级认知技能。专注于高级技能和学习成果尤为重要,因为表现评估通常非常耗费时间。
- 确保任务对学生来说清晰易懂。表现评估通常需要多个步骤,因此学生需要具备必要的先决技能和知识,以及清晰的说明。仔细的支架对于成功的表现评估至关重要。
- 通过在教学过程中向学生提供评分标准,明确说明对表现的期望。这不仅有助于学生理解预期,而且还能确保教师对自己的期望明确。在计划表现评估时,仔细思考这一点可能对教师来说很困难,但这是至关重要的,因为它通常会导致实际评估和提供给学生的说明的修改。
- 减少完成任务中非必要技能的重要性。哪些技能是必不可少的取决于任务的目的。例如,对于一篇科学报告,使用出版软件是必不可少的吗?如果评估的目的是让学生展示科学方法的过程,包括撰写报告,那么报告的格式可能并不重要。然而,如果目的包括整合两个学科,科学和技术,那么使用出版软件就很重要。由于性能评估需要时间,因此很容易在没有仔细考虑所有技能是否对学习目标至关重要的情况下包含多种技能。
“作品集是学生作品的有意义的集合,它讲述了学生成就或成长故事”(Arter、Spandel 和 Culham,1995 年,第 2 页)。[7] 作品集是有目的的学生作品的集合,而不仅仅是学生所有作品的文件夹。作品集用于各种目的,开发作品集系统可能会令人困惑和压力重重,除非教师明确其目的。
当主要目的是为了学习的评估时,重点在于学生的自我反思和学习责任。学生不仅选择他们想要包含的样本,而且还反思和解释自己的工作。包含这些信息的档案可用于帮助沟通,因为学生可以向他们的老师和家长展示和解释他们的工作。侧重于学习评估的档案包含学生的作业样本,这些样本证明了课堂成绩、毕业、州立要求等方面的成就。通常,学生在这些档案中包含的工作选择较少,因为这种评估需要一些一致性。例如,肯塔基州要求四年级和七年级学生提交的写作档案必须包含一份自我反思陈述和三个写作示例(反思性、个人经历或文学和交互性)。学生确实可以选择他们每种类型的写作作品中哪些作品包含在档案中。[8]
档案可以设计为侧重于学生进步或当前成就。例如,可以收集英语学习者一年来的口语录音来展示学习的进步。学生进步档案还可以包含单个作品的多个版本。例如,一个写作项目可能包含关于最初想法、大纲、初稿、同伴或老师对初稿的评论、第二稿和最终完成品的笔记。如果重点是当前成就,则只包含最近完成的工作样本。
档案可以专注于记录学生活动或突出重要成就。记录档案是包容性的,包含所有工作样本,而不是专注于一个特殊优势、最佳作品或进步。相比之下,展示档案专注于最佳作品。最佳作品通常由学生确定,因为这种档案的一个目标是让学生学会如何识别能证明他们所知和所做的产品的。学生不必孤立地识别出他们最好的作品,还应该利用来自老师和同伴的反馈。
最后可以区分完成的档案 - 例如用于求职 - 与工作档案,工作档案通常包含日常工作样本。工作档案会随着时间推移而发展,并且不打算用于学习评估。工作档案的重点是发展想法和技能,因此应该允许学生犯错误,自由地评论自己的工作并响应老师的反馈。完成的档案专为特定受众使用而设计,所选产品可以来自工作档案。例如,在一个师范教育课程中,工作档案可能包含从所有课程中获得的工作样本。学生可以开发一个完成的档案来证明自己已经掌握了师范教育课程所需的胜任力,以及另一个用于求职的完成的档案。
在课堂上很好地使用作品集有很多优势。它们提供了一种记录和评估成长的方式,比选择题测试更细致入微。此外,作品集可以轻松地融入教学中,即用于学习评估。作品集还鼓励学生进行自我评估和反思,以及对学习的拥有权。使用课堂评估来提高学生的学习动机是学习评估的一个重要组成部分,这将在下一节中进行考虑。
但使用作品集也有一些主要缺点。好的作品集评估需要大量的教师时间和组织。需要时间来帮助学生理解档案的目的和结构,决定要收集哪些工作样本,以及自我反思。其中一些时间需要在一对一的会议中进行。课外时间审查和评估档案也极其耗时。教师必须权衡花费的时间是否值得使用档案带来的好处。
- 评估作品集的可靠性并消除偏差可能比在建构式反应评估中更难,因为产品变化更大。佛蒙特州在全州范围内使用作品集进行四年级和八年级写作和数学评估的经验令人警醒。教师在评估档案时使用了相同的分析评分量规。在前两年实施中,从学校收集样本并由外部教师小组进行评分。在第一年,评审员之间的一致性(即评审者之间的一致性)对于数学和阅读来说很差;在第二年,评审员之间的一致性对于数学有所提高,但对于阅读没有提高。然而,即使数学成绩有所提高,可靠性仍然过低,无法将档案用于个人学生的问责制(Koretz、Stecher、Klein 和 McCaffrey,1994 年)。当可靠性低时,效度也会受到损害,因为不稳定的结果无法有意义地解释。
如果教师在课堂上使用档案,表 10- 8概述了实施所需的步骤。如果学校或地区有现有的档案系统,这些步骤可能需要进行修改。
- ↑ Popham, W. J. (2005). Classroom Assessment: What teachers need to know. Boston, MA: Pearson.
- ↑ Stiggins, R. J. (2002). Assessment crisis: The absence of assessment FOR learning. Phi Delta Kappan, 83(10), 758-765.
- ↑ Airasian, P. W. (2000). Classroom Assessment: A concise approach 2nd ed. Boston: McGraw Hill.
- ↑ Airasian, P. W. (2004). Classroom Assessment: Concepts and Applications 3rd ed. Boston: McGraw Hill.
- ↑ http://www.sanford-artedventures.com
- ↑ http://www.tennessee.gov/education/ci/standards/music/dance912.shtml
- ↑ Arter, J., Spandel, V., & Culham, R. Portfolios for assessment and instruction. ERIC Digest #388890"
- ↑ http://www.kde.state.ky.us/KDE/Instructional+Resources/Curriculum+Documents+and+Resources/Student+Performance+Standards/