教育基础与教学评估/标准化测试/For
Lcraw005 (讨论) 2009年4月10日(UTC)23:23
准备、手心出汗、对结果的焦虑,这些都可能是热恋的症状,也可能是令人恐惧的“T”字词——测试,特别是标准化测试,它让教育系统中从美国总统到学校董事会、校长、教师和学生的每个人都感到焦虑。
在下面的文章中,我们将讨论标准化测试,它的批评,它存在的必要性,以及如何使用结果作为一名教师帮助缩小成绩差距。
“离这十八英里外有一所学校,80% 的学生享受免费和减价午餐... 他们的 绝对排名更高,”他对他的教职工说,“不要再跟我提 我们的孩子处于不利地位。‘那条狗不会 狩猎!’” |
学习目标
1. 学生能够识别标准化测试的基本科目领域,并了解其评分方式。
2. 学生能够识别反对标准化测试的论据。
3. 学生能够识别标准化测试的益处。
4. 学生能够认识到一些方法,这些方法可以帮助他们作为一名教师帮助缩小课堂中的成绩差距。
自20世纪70年代以来,标准化考试在美国一直受到许多批评,但其基本目的是作为一种衡量标准或规则,用于衡量低年级学生的准备程度和高年级学生对核心学科的掌握程度(Rock, Stenner, 2005)。
入学考试,如皮博迪图片词汇测试-修订版和斯坦福-比奈智力测试,旨在确定进入学校的幼儿园儿童的准备程度(Rock, Stenner, 2005)。这些测试测量孩子的词汇量和认知能力(Rock, Stenner, 2005)。类似的测试在全年进行,以小组或个人的形式进行,其中许多测试是自适应的,并测量进步情况,它们不是静态的衡量指标,不会导致及格或不及格的等级(Rock, Stenner, 2005)。相反,自适应测试使用的是所谓的“地板/天花板规则”(Rock, Stenner, 2005)。这条规则意味着(在词汇测试的情况下),一组单词对学生来说很容易,低于地板,而另一组单词对学生来说更难,高于天花板(Rock, Stenner, 2005)。全年的进展将决定天花板和地板将移动到哪个水平(Rock, Stenner, 2005)。
其他测试,如弗吉尼亚州使用的SOL,用于确定全年教授的核心学科的掌握程度(Bagin, 1994)。通常,这些测试测量对数学、科学、阅读和写作的理解(Bagin, 1994)。一些测试,比如SOL,是在预定的时间进行的,评分是基于多项选择、简答题或开放式问题(Bagin,Stenner 1994)。另一种测试类型,在肯塔基州等州使用,采用的是档案系统,学生全年不断添加内容,并在一年中的另一个时间进行预定时间的测试(Wolf, Borko, Elliot, 2000)。
所有这些测试都是根据百分位数系统进行评分的(Rock, Stenner, 2005)。也就是说,学生在考试中取得的成绩与其他在相同年级水平参加考试的学生相比如何(Rock, Stenner, 2005)。例如,一名学生在考试中取得90百分位的成绩,意味着他的成绩比参加考试的90%的其他学生都要好(How Standardized Testing, 2009)。一名学生在考试中取得10百分位的成绩,意味着他的成绩只比10%的同龄人好(How Standardized Testing, 2009)。
这些考试的成绩被用于多种用途。从全国范围来看,这些成绩告诉我们的总统我们的学生整体上以及在州一级取得了怎样的成绩(Bagin, 1994)。各州根据考试成绩分配资金,各学校则确定哪些项目需要改进(King, Houston, Middleton, 2000)。教师利用这些成绩来评估自己的教学方法,当然,这些成绩也偶尔用于确定学生是否具备继续升学的准备条件(Rock, Stenner, 2005)。
反对当前标准化测试方法的人出于多种原因不喜欢皮博迪和SOL等测试,但主要的两个论据是反对其可靠性以及他们认为测试本身存在种族偏见。
为了使一项测试被认为有用,它首先必须是可靠的(Rock, Stenner, 2005)。也就是说,结果应该是一致的(Rock, Stenner, 2005)。衡量测试一致性的一种方法是对具有代表性的学生样本小组进行样本运行(Rock, Stenner, 2005)。测试的样本运行以两种不同的方式进行:
1. 对两个版本的测试进行运行,这两个版本包含类似的问题。如果测试是可靠的,这两个测试组的测试者应该得出类似的结果(Rock, Stenner, 2005)。
2. 将一个测试随机且均匀地分成两部分(Rock, Stenner, 2005)。对这个测试进行运行,并通过这些结果的相似性来确定可靠性(Rock, Stenner, 2005)。
这些样本运行的结果的测量方式与标准化测试结果的测量方式基本相同。90%的评分意味着一项测试在90%的时间里会产生类似的结果,而10%的评分意味着一项测试在10%的时间里才会产生类似的结果。
由于人们普遍认为,无法准确预测成绩范围,因此,80%或更高的可靠性评分被认为是符合国家标准的,而批评者则持不同意见(Thernstrom, 1992)。
批评者认为,如果一项测试在20%的时间里都产生不同的结果,那么这项测试不可能测量它本应该测量的东西(Thernstrom, 1992)。
其他批评测试的人认为这些测试存在种族偏见,原因有多种(King et al., 2000)。这种观点的一个依据是,欧洲裔学生的成绩差距通常远高于少数族裔学生的成绩差距(Thernstrom, 1992)。一项学业准备测试显示,当将欧洲裔学生和非洲裔学生的考试结果进行比较时,前者的成绩在76%的时间里都更高,而后者只在24%的时间里成绩更高(Rock, Stenner, 2005)。
另一方面,一些问题被认为存在种族偏见,因为它们被认为与文化无关(Thernstrom, 1992)。例如,一个问题是“小牛的名字是什么?”,对于那些在农村地区长大的人来说比那些住在城市地区的人来说更相关(Thernstrom, 1992)。一些批评者甚至认为语言测试存在种族偏见,因为他们认为一种口语形式是正确的,而另一种口语形式是错误的(Thernstrom, 1992)。
虽然标准化测试的批评者和支持者可以整天争论不休,但评估学生以确定他们和他们的教师以及学校的进步情况是不可否认的。
标准化测试在学生教育的早期评估他们的准备程度,包括学业准备程度和行为准备程度(Rock, Stenner, 2005)。学生及其家长能够至少大体上衡量他们的进步情况以及需要改进的方面(Wolf et al., 2000)。
在高年级,标准化测试衡量学生与同龄人相比的成绩,从而衡量学生及其教师的教学效果(Bagin, 1994)。虽然这些测试确实根据学生在这些测试中的成绩对学生进行排名,但一些学校已经利用这些成绩来改革他们的系统,并进而大幅度地改进他们的方法(Wolf et al., 2000)。
在经济萧条地区,例如肯塔基州东部,学校在校长们的强有力领导和老师们的奉献下,取得了更高的评价(Wolf 等人,2000)。一所这类学校的校长说:“距离这里18英里的一所学校,有80%的学生享受免费或减价午餐……但他们取得了进步,排名也更靠前。”这位校长对他的老师们说:“别跟我说我们的孩子处于劣势。那是不可能的。”他使用的是当地的一句俗语,意思是借口无助于学校的进步(Wolf 等人,2000)。
与其找借口,不如效仿那些面对糟糕的标准化考试成绩并利用它们来改进学校的学校,就像一位校长说的,把这些成绩当作“股票市场行情”。他们将某个领域表现不佳视为改进该部门的信号(Wolf 等人,2000)。他们让老师们学习新的教学方法,并共同努力帮助孩子们进步(Wolf 等人,2000)。
尽管目前仍无定论,即是否存在更好的方法来评估学生的个人进步,但为了带来改变,学生间相互比较的共同标准的必要性比以往任何时候都更加迫切。
因此,问题是,如果这些考试并不完全可靠,而且对某些学生来说无关紧要,我们该如何改变现状?
答案:成为具有创新精神的前瞻性教师!
一位校长表示,最优秀的老师,实际上本身也是学习者(Wolf 等人,2000)。他们积极寻求新的方法来补充和修改他们的教学(Wolf 等人,2000)。这些老师与家长、学生和辅导员一起工作,以了解每个学生的个人需求(Wolf 等人)。最后,他们无视他人的悲观情绪,提高对学生的要求,并使课程内容与可能不适合学生的学习内容相关联(Wolf 等人,2000)。
目前,一些公司在各个州之间巡回举办研讨会和教学示范(Wolf 等人,2000)。这些研讨会涵盖从写作和数学等核心领域到如何在课堂中融入技术的各种内容(Wolf 等人,2000)。如今的理念是“更聪明地工作,而不是更努力地工作”(Wolf 等人,2000)。参加继续教育的老师普遍反馈积极(Wolf 等人,2000)。一位老师在参加了关于写作的教学示范后说,示范中让学生在叙事作业中加入反思,她说:“我认为我在这次示范中学到的,并不是与我之前完全不同的东西,而是对现有教学的补充。我对此真的感到兴奋!”其他课程教老师如何在日常活动中融入技术,使计划更容易,并使课程更具连贯性(Wolf 等人,2000)。
此外,学校似乎在存在社区意识的情况下表现更好(Wolf 等人,2000)。在一所取得重大进步的学校,一位老师谈到,学生是学校的责任,而不仅仅是他们那一学年碰巧遇到的某个老师的责任(Wolf 等人,2000)。敬业的老师有时每天会与其他老师和学生辅导员开会,以便更好地了解学生的背景和特殊情况(Wolf 等人,2000)。
最后,尽管对标准化考试存在批评,但当今优秀的教师并不认为他们的学生能力有限,或者无法学习任何给定的概念。相反,这些老师每天都在努力使学习内容与学生相关,并制定适合每个学生的教学计划。
1. 鼓励家长与孩子交谈,向他们解释教育的重要性;教育是美国职业成功的必要步骤。(在一项研究中,高成就者普遍有表达这种观点的父母。)(Lee,1994) 2. 经常评估学生,跟踪他们的进步,并在整个学年给予鼓励。 3. 理解评估成绩不佳可能是语言障碍或家庭环境压力造成的, 并制定计划解决这些问题(Lee,1994)。 |
1. 在 SOL 等标准化考试中,一名学生在百分位排名中位于第 90 位,这意味着什么?
a)Better than 90 percent of his/her peers. b)Worse than 90 percent of his/her peers. c)Worse than 90 of his/her peers. d)Better than 90 of his/her peers.
2. 以下哪个不属于对标准化考试的批评?
a)It is unreliable. b)Its' results can be used by teachers and the educational system as a whole to improve their methods. c)It is racially biased because it asks questions that are unrelated to some students' culture. d)It puts unreasonable pressure on students and teachers to do well.
3. 老师刚刚审查了今年的 SOL 成绩。她发现,即使是在数学和语文方面都取得高分的学生,似乎也无法理解长除法。她应该...
a)Focus on verbal instruction since the students did well in that area. b)Use the same verbal instruction method year after year since that seemed to work and reform her long division plans. c) Reteach the lesson in long division and find a reliable teacher whose students did well on that part of the test for some ideas on how to improve her instruction. d) Give up, these disadvantaged kids are incapable of learning anything anyway!
4. 一位安静、勤奋的亚裔学生 Chris Young 的学习成绩越来越差,在 SOL 考试的阅读部分表现不佳。他拒绝参加课后辅导,只与其他亚裔学生交往。以下所有选项都有可能鼓励这位学生取得进步,除了…
a)Give Chris a sheet of resources that offer online help to students with language barriers. Being online might reduce any embarrassment he may have in learning English as a second language if this is a problem he is encountering. b)Discuss his progress with his family. In some Asian cultures failure is seen as an embarrassment and Chris might not admit that he is having difficulty before it is too late. c)Create lesson plans that allow for group work so that Chris has a chance to socialize with different types of students and might be more comfortable with getting help. d)Ignore the issue Asian kids ALWAYS do better on things like standardized testing, this is obviously a failure of the test!
1. A 2. B 3. C 4. D
Bagin, C.B. (1994, February 2). What parents should know about standardized testing in schools. Retrieved April 11, 2009, from Standardized testing Web site: http://www.kidsource.com/kidsource/content/standardized.testing.html
(2009). How standardized testing damages education. Retrieved April 11, 2009, from Fair test Web site: http://www.fairtest.org/facts/howharm.htm
King, L.A., Houston, I.S., & Middleton, R.A An explanation for school failure: moving beyond Black Inferiority and Alienation as a policy-making agenda. British Journal of Educational Studies, 49, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/3122363.
Lee, J.S., & Bowen, N.K. (2006). Parent involvement, cultural capital, and the achievement gap among elementary school children. American Educational Research Journal, 43, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/3699418.
Lee, S.J. (1994). Behind the model-minority stereotype: voices of high- and Low-Achieving Asian American students. Anthropology & Education Quarterly, 24, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/3195858
Rock, D.A., & Stenner , J.A. (2005). Assessment issues in the testing of children at school entry. The Future of Children, 15, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/1602660.
Thernstrom, A. (1992). The drive for racially inclusive schools. Annals of the American Academy of Political and Social Science, 523, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/1047586
Wolf, S.A., Borko, H., Elliot, R.L., & McIver, M.C. (2000). "That dog won't hunt":exemplary school change efforts within the Kentucky reform. American Educational Research Reform, 37, RetrievedMarch 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/1163528.