SA NC 调查 / 第 5 章

进行调查：面向 GET 和 FET 数学和科学教育工作者的资源手册

管理和评估调查

本章基于玛丽娜·德·朗格的工作，她是来自萨尔达尼亚湾的小学科学教育工作者，也是 2002 年数学和科学教育工作者年度大奖获得者。她热衷于调查，并是今年 MSTotY 研讨会将“调查”作为主题的主要推动者。

管理学校或“博览会”目的的科学或数学调查的建议程序

为了从学习者调查中获得最大收益，必须谨慎地管理这个过程。重要的是要确保学习者（有时还有他们的父母）充分了解这个过程，以及对他们的具体期望。以下要点将对您计划调查有所帮助。

1. 清楚说明：“本次调查将用于... 例如，最终年级评估/地区竞赛等，并将计入科学年终成绩的 50% / 之后可提交参加全国竞赛等...”。

2. 清楚说明并公布时间表和截止日期。

3. 在宣布后的第一周内，必须由组织者/教育工作者与参与者/学习者充分讨论评估标准（见下面的评估表格）。

4. 学习者选择主题是最重要的部分。这些必须在宣布后的一周内最终确定。

5. 教育工作者应与每位学习者一起审查可能的主题，并根据调查提供的标准测试主题。获得对“重点问题”的澄清并达成一致。

6. 学习者必须立即开始进行文献综述/研究工作，并在调查的这个初步阶段尽可能多地获得外部帮助。

7. 在宣布后一个月内（或更短时间，具体取决于总体时间表和截止日期），教育工作者必须在与学习者一对一的面谈中审查每位学习者的主题、重点问题、假设、计划和“研究设计”。

8. 调查报告必须在商定的期限内提交。在调查截止日期，所有报告都必须提交，无论其准备情况如何。（除非严重扰乱了年度计划，否则不允许延期，因此教育工作者必须认真监控进度。）

进行独立作业/项目/调查可以培养极其重要的态度、生活技能以及科学和数学技能，例如，时间管理、自律、毅力、仔细、周到和富有洞察力的工作、反思、准确性等。这些技能和态度将在高级阶段结束时进行评估。

为了让学习者认识到遵守截止日期等的重要性，可以让他们签署一份“合同”。

声明：我理解并同意遵守所有条件和

截止日期，这些条件和截止日期已由：__________________________________ 向我解释。

学习者签名：__________________________________

日期：____/____/200____

家长签名：__________________________________

日期：____/____/200____

发布通知和标准：日期：____/____/200____

教育工作者签名：__________________________________

日期：____/____/200____

显然，调查需要花费大量时间来准备。因此，必须认真管理这个过程，准时开始并遵守时间表至关重要。如果要让调查达到其教育目的，则必须为每位学习者分配时间进行讨论和咨询。最多可以管理 35 名学习者。对于人数超过 35 人的班级，建议以两人一组的形式进行。进行调查的问题在于，我们希望学习者获得的体验实际上是一种私人体验，当它成为个人学习体验时，它的力量最大。当学习者成对时，无法保证每个人都能从他们的体验中获益。因此，选择均衡的组合非常重要，组合中的两个人都要平等地做出贡献并良好地沟通，以便他们相互学习。

科学调查/项目评估标准（包括报告和调查结果的介绍）

姓名：___________________________________

主题：___________________________________

	标准	分数
1	主题选择和目标您从哪里获得您想法的灵感/来源？ (2) 您的调查想法是否相关且有用？为什么？ (1) 描述您的调查目标 (2)	5
2	重点问题描述重点问题。您的重点问题清晰吗？ (1) 它可以公平地进行测试吗？讨论一下。 (3) 确定重点问题中存在的所有可能变量？ (1)	5
3	变量自变量您将故意改变什么？ (3) 因变量：您将测量什么？ (3) 保持不变的变量将被固定/保持不变/不允许改变的变量。 (4)	10
4	假设、怀疑、直觉和有根据的猜测在开始调查之前解释和描述您的假设，您预计会有什么结果？ (5)
5	文献综述（至少两个来源）从其他来源收集的有关主题的信息？ (1) 仔细引用来源，例如网站、标题、作者等。 (2 X 2)	5
6	计划调查记录您进行调查所需的材料。 (3) 记录您的重点问题是否以及如何改变。 (2) 您什么时候开始？每个阶段何时何地完成？ (5)	10
7	收集数据描述调查的设计，特别是数据收集方法。 (5) 逐步描述您的实际工作，您所做的任何实验等。 (5)	10
8	数据展示和选择方法的原因：任何 3 种方式，例如叙述性说明、模型、问卷的计数表、数值数据的表格、视频、录音、照片等。（3 种方法，每种方法最多 5 分，即适合的方法最多 5 分，不太适合的方法最多 3 分，不适合的方法最多 1 分。）	15
9	数据处理和处理用于处理数据以提取信息的方法，例如图表。 (3) 从处理和处理后的数据中得出的结论。 (5) 将假设/预测与调查的实际结果进行比较。 (3) 讨论您的假设是否得到证实或被拒绝。 (4)	15
10	调查项目的口头/视觉演示：演示布局：顺序、有效使用 3-5 种颜色演示方式：主题知识、热情、自信评估者分配 10 分中的分数	5
11	学习者对项目/调查的自我评估你会怎么做才能做得更好？ (在评估后提供一份个人手写说明，并审查其他人的调查。)	15

关于评估调查的提示。

归根结底，教育工作者和学习者在调查中付出的努力是相当大的，因此值得仔细考虑和计划评估。调查为评估实际中的科学和数学思维提供了绝佳的平台。但这同时也意味着评估必须是持续性的，以便从过程中获取尽可能多的价值。评估可以采取不同的形式，具体取决于特定时间的具体情况。以下是一些想法。

自我评估。 学习者评估自己。当你

讨论课堂作业或家庭作业时，这种方法效果很好，尤其是在进入下一个主题时。它可以帮助你回顾已完成的工作，为下一步行动奠定基础，节省时间并提供及时反馈。它的缺点包括无法看到个别学习者的问题。学习者往往会给自己打对勾，即使他们实际上做错了。有时候，他们会在步骤错误的情况下，将答案标记为正确。

同伴评估。 与自我评估类似，但学习者互相评估。

可能是小组成员互相评估。这种方法存在学习者屈服于同伴压力，并为错误答案打分的风险。在进行同伴评估时，控制至关重要，必须检查学习者的书籍以确保准确性和诚实。当一个班级习惯了这种方法并看到了准确评估的价值时，它就会变得更容易。

评分标准。 效果很好，如果设计良好，它们是评估

学习者的最佳工具之一。当学习者展示他们调查结果时，评分标准特别有用。要评估的关键项目及其对应的评分标准清晰列出，学习者的优势和劣势可以一目了然地“定位”。

教育工作者评估。 是最常见的形式，因为它是最重要的。

为了评估个人优势和劣势，没有比教育工作者审查和批阅每个学习者的作业更好的方法了。目的不仅是分配分数，还要找到需要进行补救工作的基础。其他评估形式增加了价值，但前提是它们能补充教育工作者自己对学习者书面作业的审查。这可能很费时，但它可以让你了解你的学习者。学习者至少一半的家庭作业和课堂作业必须由教育工作者进行评估。正式测试必须由教育工作者进行批阅，理想情况下，即使非正式测试也至少要进行审查。

评估演示和产品

有一些标准类型的评估工具，但除了通用类型外，工具很少是“一刀切”的。所以我们通常为特定的活动构建工具。当个别学习者或小组展示他们在分配给他们的任务上的“研究”结果时，可以使用像下面的工具。这个例子将用于他们解释人体中“系统”的概念时。为每个项目分配一个“最大可能”分数，为教育工作者提供一个基准或标准，根据该基准或标准来判断项目的表现。评估的一个重要原则是确保学习者在事前明确了解他们将根据哪些标准进行评估。当学习者知道这一点时，他们就开始发展自己的“内部”标准。

	可能得分	获得分数
1. 了解系统的含义，至少在任何情况下提及三个系统，解释至少两个独立系统之间的联系。	3	1
2. 正确且恰当地使用生物学术语，例如红血球，白血球。	2	1
3. 至少提到人体中的两个系统，并了解每个系统的作用，例如排泄系统——肾脏去除废物，肺部去除二氧化碳等。	2	1
4. 演示：清晰，逻辑，简洁，集中等。	3	2
总计	10	5

类似的工具可用于评估已构建的模型。在这种情况下，模型是胸腔内的肺部。它展示了如何通过使用膈肌增加胸腔的体积来使肺部膨胀和收缩。这个模型可以用一个两升的冷饮瓶、一个气球、一根塑料吸管和一个钻有孔的软木塞来制作。在这个活动中，学习者会得到明确的指示。

	是	否
1. 模型是否按照指示制作？	是
2. 模型是否标注了？		否
3. 学习者能否将模型的部件与呼吸系统的部件匹配？例如：气球=肺部	是
4. 学习者能否解释塑料的运动是如何影响气球的运动的？		否
5. 气球是否能很好地膨胀或收缩（即无泄漏）？	是
总计	3

此类工具的分数可以与总体 5 分制相关联，例如：优秀 (5/5) 良好 (4/5) 满意 (3/5) 不满意 (2/5) 较差 (0-1/5)。

用于描述不同级别的词语是选择问题。例如，如果是 5 分制，使用的五个词语或短语必须描述一个逻辑的性能级别序列，向学习者传达教育工作者将如何判断他们的表现，并且必须向学习者表明他们在任务中哪些地方表现良好或糟糕。有了评估工具，教育工作者和学习者可以决定如何弥补不足并发挥优势。

评分标准

评分标准使用词语来描述连续的性能级别。它们是有用的评估工具，但除非它们经过精心构建并以公正、洞察力和谨慎的方式使用，否则它们毫无价值。无论评分标准有多好，如果教育工作者没有始终如一地使用评分标准，学习者就会对这种方法或工具失去信心。当学习者对教育工作者对其表现的判断缺乏信心时，他们就会错过良好评估实践可以提供的学习机会。调查的评估几乎可以像活动本身一样，教授关于调查过程的知识。

以下是一些评分标准。在第一个示例中，我们有一个评分标准来评估技术课上的设计。第二个评分标准用于评估实际的设计图纸。第三个评分标准与自然科学的 RNCS 学习成果 (LO) 和评估标准 (AS) 相关。

用于评估技术课上的设计的评分标准。

学习者表现——> 特征	... 超出要求	... 满足要求	... 部分满足要求	... 不满足要求
简洁性和使用的材料	清晰简洁，很好地使用合适的材料	相对简单，没有使用最合适的材料	过于复杂，材料不合适	过于复杂和不切实际，没有考虑合适的材料
独创性	巧妙，富有创意的设计，证明对问题的深刻理解	令人满意的设计，表明对问题的理解	糟糕的设计，表明对问题的理解不足	没有明显对问题的理解
有效性	尽管简单且使用最少的材料，文章仍然有效	文章应该有效	文章在当前设计下不太可能有效	文章无效
视觉吸引力	整洁，赏心悦目，时尚	整洁且引人注目	不令人满意	丑陋，没有视觉吸引力
易于制作	简单，没有过于复杂或技术要求高的部分	简单，制作起来相对容易	过于复杂，制作起来很困难	无法按照当前的设计制作

类似的评分标准可用于评估学习者的实际设计图纸。

学习者表现——> 特征	... 超出要求	... 满足要求	... 部分满足要求	... 不满足要求
简洁性	非常清晰简洁，关键特征一目了然	清晰，大部分可以理解	过于复杂，难以理解	图纸没有“流动性”，无法用作工作计划
清晰度和整洁度	清晰，非常整洁，布局便于遵循	整洁，大部分清晰	设计糟糕，呈现混乱	设计混乱，难以理解
精心程度	非常用心，表明对工作的真正自豪感	表明一定程度的用心	工作仓促且“草率”，错误很多	没有用心，没有考虑
标签	标签清晰，组织合理，排列整齐	清晰且组织有序	标签随机且不完整，没有逻辑排列	标签很少或没有，现有的标签没有帮助
制作说明	简单明了	大部分清晰，但不完整	有一些说明，但没有实质意义	没有

任何好的评分标准都可以被改编或用作模板来创建其他评分标准。 2007 年开始实施的修订版国家课程标准 (RNCS) 要求评估 GET 阶段的四个性能级别。因此，可以通过设计基于学习成果和评估标准的评分标准来评估特定任务和活动，这些标准适合于该任务。在这些示例中（改编自 Heinemann Publishers 的《All Aboard Science 7》），涵盖了各种学习任务。第一个示例涉及对金属腐蚀原因的调查。

学习成果 1：科学研究。学习者将能够对自然现象的好奇心做出自信的反应，并在科学、技术和环境背景下调查关系和解决问题。
	4 级学习者的表现超过了评估标准	3 级学习者的表现满足了评估标准	2 级学习者的表现部分满足了评估标准	1 级学习者的表现不满足评估标准
评估标准 1：确定调查中要考虑的因素。	确定所有可能导致腐蚀的因素。	确定一些可能导致腐蚀的因素。	确定可能导致腐蚀的因素，但需要帮助。	无法识别可能导致腐蚀的因素。
计划收集数据以进行调查。	计划收集来自生锈调查的数据。	计划从调查中收集数据。	无法独立计划从调查中收集数据。	无法计划从调查中收集数据。
AS2: 进行调查，收集数据并准确记录数据。	坚持以专注和谨慎的态度系统地收集和记录数据。	在调查期间仔细工作以系统地收集数据。	在调查过程中漫不经心地收集数据，缺乏逻辑或系统性。	收集数据时不专注也不坚持，漫不经心，玩弄愚蠢。
AS3: 评估数据并传达发现。	列出所有支持发现的证据，处理反面证据并陈述明确的结论。	列出一些支持发现的证据并陈述令人满意的结论。	列出少量支持发现的证据，陈述一些结论，但需要帮助。	无法列出任何合理的证据，即使给出证据点也无法陈述结论。

对敏感问题的调查会导致涉及偏见和情感的争论。在科学中，认识到并控制这些干扰很重要。这就是为什么科学家试图（尽管并不总是成功）考虑到我们积累知识的方式，以及个人感受和流行观念在试图理解我们所生活的世界中所起的作用。自然科学的第三个学习成果（LO3）涉及这个问题，并且 notoriously 难以评估。当我们讨论引发情感和矛盾的问题时，指标可以提供帮助。但我们不应允许这种困难使我们退缩，因为处理需要解释历史证据和不同观点的主题对我们发展成为具有科学素养的人至关重要。例如，自然科学 LO3 AS1 的指标可以适用于金矿开采和金矿石加工、炸药的开发以及冷藏对国际农产品贸易的影响等问题。

学习成果 3：了解科学技术、社会和环境之间的相互关系。
	... 超出要求	... 满足要求	... 部分满足要求	... 不满足要求
AS1：识别人们如何建立对其知识的信心，例如：这些陈述可以应用于钢铁生产）。	对人类服务制造工艺的历史发展进行批判性和审慎的评论，并看到这些工艺与其他历史事件或趋势之间的联系。	对人类服务制造工艺的历史发展发表随机的、无关的评论，但正在逐渐掌握“全局”。	对人类服务制造工艺的历史发展发表一些有力的评论，但无法看到或建立这些工艺与其他事件之间的联系。	无法对制造工艺的历史发展发表评论。
AS2：了解地球资源的可持续利用，确定做出关于资源利用判断所需的信息。	在考虑了所有可用的社会、经济和环境因素后，就圣卢西亚湿地地区沙丘开采问题提出清晰、平衡、合理的论点。	在考虑了大多数可用的社会、经济和环境因素后，就圣卢西亚湿地地区沙丘开采问题提出了一些有力的论点。	就圣卢西亚湿地地区沙丘开采问题提出了一些无关的论点，但没有考虑所有可用的社会、经济和环境因素。	无法就圣卢西亚湿地地区沙丘开采问题提出任何合理的论点，似乎无法理解除少数社会、经济和环境因素之外的其他因素。

策略：您自己的评估策略。

Maryna de Lange 制定了自己的评估策略，以便她学生作品的几个可评估方面计入年终成绩。她写道：“我平衡了五种形式的评估，以便满足每个学生的偏好。我使用这些评估来构建学生的档案，这些档案保存在我的主文件中。我定期在形成性记录表上记录我的观察结果。学生可以选择他们想保留在档案中以用于晋升目的的作品。评估包括教师评估、同伴评估和自我评估。我使用的评估形式是

(a) 四次测试和两次考试。测试各计 30 分，考试设定在 100 到 150 分之间。然后将测试和考试的总分分别转换为 60 分。[总计 60 + 60]

(b) 八项课堂或家庭作业活动，每项计 15 分。120 分转换为 45 分。[总计 45 分]

(c) 两个项目，分别计 40 分和 35 分。[总计 40 + 35 分]

(d) 两个作业，每个计 30 分。[总计 60 分]

(e) 两次调查，每个计 30 分。[总计 60 分]

全年科学总分 360 分。下面的饼图展示了这一策略。请记住，在评估学生全年的表现时，还可以使用档案和形成性记录。目标导向评估要求进行持续评估以确定学生的进步。该策略是否满足这些要求？

您会同意，这一评估策略确实提供了一幅非常全面的图景。饼图还显示，调查和项目（两者都涉及学生独立地处理他们自己选择的问题）占总分的 1/3 以上。

按评估形式划分的比例