社会研究方法/实验

经典实验

-最常见的实验包括三个主要部分

    1) Independent and Dependent Variables
    2) Pre-testing and Post-testing
    3) Experimental Control Groups

自变量和因变量

    Independent variable- A manipulated variable, in an experiment or study, whose presence or degree incurs a change in the
    dependent variable.
    Dependent Variable- The variable being studied in the experiment; it is expected to change when the independent variable is changed.

因此，一个典型的实验将检验自变量对因变量的影响。
自变量通常是“实验刺激”。
它也可以被描述为一个二分变量。

ex. having two characteristics
 -present or non-present

自变量和因变量必须是无限的。

ex. a variable may be the independent variable in one study but serve as a dependent variable in another experiment.

在你的研究中定义自变量和因变量非常有用和重要，这应该在任何实验开始之前完成。

前测和后测

    Pre-testing- the initial measurement of a dependent variable among subjects
    Post-testing- the re-measurement of a dependent variable among subjects, after they have been introduced to the independent variable.

一旦进行前测和后测，第一次和最后一次测量之间的任何偏差都会被陈述为自变量的特征。

受试者往往会因为参加实验而发生行为改变。此类变化的例子包括

霍桑效应- 受试者在实验中表现更好
需求特征- 受试者试图给出他们认为“正确”的答案，而不是诚实的答案
安慰剂效应- 受试者对他们相信正在接受药物做出反应，无论他们是否真的接受了药物。

实验组和控制组

    Experimental Group- a collection of subjects to whom the independent variable is administered.
    Control Group- a collection of subjects that do not receive the independent variable but should mimic the experimental group.
    The comparison of both groups at the conclusion of the experiment will point out the effects that the independent variable has had.

进行实验研究时，密切观察实验组和控制组非常重要。
使用控制组可以帮助研究人员观察实验中因自变量引起的改变，使这种改变更明显。

(插入图 pg 234)

双盲实验

    Double-Blind experiment- an experimental design in which the researchers are ignorant to which groups are experimental or control.

使用双盲实验可以减少研究人员对结果的偏差。

ex. If you know which group is the experimental group you may pay more attention to that group, potentially to the extent that you ignore the control group entirely.
    This will cause a problem at the end of the experiment, because you will not be able to witness or analyze the full effects that the independent variable has had.

皮格马利翁效应- 当人们对某人期望更高时，他们的表现会更好

选择受试者

例如，大学生经常被用于实验。虽然他们是一个相对容易获取和分析的群体，但一个值得关注的问题是他们的普遍性：鉴于大学生是一个如此庞大而多元的群体，对他们进行概括是否有道理？这个问题指出了使用大学生这样庞大和异质群体的一个潜在缺陷。

概率抽样、随机化和匹配是实现实验组和控制组可比性的方法。

随机化是首选方法。

然而，随机化和匹配可以一起使用。

概率抽样

首先，一个包含参与研究的整个群体的抽样常数。然后，研究人员选择两个将彼此复制的样本。

相似程度（代表性）将是样本量的一个产物。

这种类型的抽样很少在任何实验中使用。

随机化- 选择人进入控制组或实验组的过程。随机化是首选方法，因为它限制了实验中潜在的偏差（系统性错误），因为它提供了“优秀”和“较差”表演者进入实验组的平等可能性。但是，仍然有可能更多的一类人最终会进入一个给定的群体。克服这种情况的最佳方法是较大的样本量；因此，当总体非常大时，随机化是理想的。

-有多种方法可以随机选择人进入控制组或实验组；例如

 1) Out of a sample of 1600, you can select every 8th person for each group. (selection rate of 1/8)
 2) Out of a sample of 100 you can select every other person to be in each group. (selection rate of 1/2; a higher rate yields a better likelihood for authenticity, and you can afford a higher rate when the sample size is small)

无论研究人员决定以何种方式将受试者分配到每个组，这个过程必须以公平和平等的方式进行，因为每个样本都将反映总体特征的反映。

匹配

    Matching- a process in which subjects are paired based on the similarities of one or more variables. One member of the pair is assigned to the experimental group while the other is assigned to a control group.

匹配是比较实验组和控制组的一种方法。

如果为所有相关特征构建配额矩阵，匹配将更加有效。

    Relevant characteristics - attributes that are related to the dependent variable.

实验组和控制组的总体平均描述应该相同。
作为一项经验法则，控制组和实验组应该具有相同的年龄、性别和种族构成等。

匹配还是随机化？

随机化优于匹配

研究人员可能不知道哪些变量与匹配过程相关，因此他应该转向随机化。
大多数用于分析实验结果的统计计算都将假设随机化过程正在进行。

组合随机化和匹配

允许研究人员发现分析情况的不同方法。

实验设计的变体

准实验研究设计

唐纳德·坎贝尔和朱利安·斯坦利介绍了三种“准实验”设计

  1) One-Shot Case Study
    -a researcher measures a "single group of subjects on a dependent variable following the administration of an independent
     variable" (cite 238)
    -represents an everyday logical reasoning
  2) One Group Pre-test|Post-test Design
    -adds a pre-test for the experimental group but does not contain a control group.
    -is difficult to analyze because it "suffers from the possibility that some factor other than the independent variable might
     cause a change between the pretest and post-test results." (cite 238)
    -describes with better evidence of influences of variables.
  3) Static Group Comparison
    -a research void of pretests for the experimental and control group.
    -uses data that will exactly pin-point the changes in a research.

实验研究中的效度问题

内部效度来源

    Internal Invalidity- explains that there is a possibility that conclusions gathered from experimental results may not precisely
    represent the occurrences in the experiment.

坎贝尔、斯坦利和托马斯·库克指出了内部效度的几个来源

1) History
-during the experiment historical events may occur. As a result the experimental results may be different.
2) Maturation
-because life is constantly changing people are influenced to do the same which can reflect in the experimental results.
3) Testing
-the processes of testing and re-testing may influence people's behavior.
4) Instrumentation
-since different ways of measuring variables are used in the pretest and post-test, how can we be sure that they are equally
comparable.
5) Statistical Regression
-the group will show some improvement over time called regression to the mean.
6) Selection Biases
-Comparisons do not have any meaning unless you have equally and fairly selected individuals for the experimental and control
group.
7) Experimental Morality
-explains that results and outcomes maybe different due to people dropping out of the experiment before it is finished.
8) Causal Time Order
-confirms that A occurred before B, if we are trying to assert that A caused B
9) Diffusion or Initiation of Treatments
-results maybe different due to an uncontrollable interaction between the experimental and control group.
10) Compensation
-people in the control group are often denied sufficient resources that the experimental group are receiving.
11) Compensatory Rivalry
-the control group may try to work harder to make its groups results better than the experimental group results.
12) Demoralization
-feelings of incompleteness or less of a human in the control group may result in them giving up.

外部效度来源

    External Invalidity- explains the possibility that conclusions gathered from results may be a "generalization about
    the real world."

坎贝尔和斯坦利描述了四种形式
所罗门四组设计
前测、后测和变量交互作用的四个规则。
仅后测控制组设计

效度内部效度

– 消除治疗效果的替代解释的能力

- 效度和信度问题的组合

- 代表实验结果可能无法准确反映实验中发生的情况的可能性

- 经典实验往往会消除所有内部效度

外部效度

- 将实验结果推广到实验本身之外的事件和环境的能力

- 实验的结果可能无法转化为现实世界

替代实验设置

基于网络的实验

如今，研究人员正在使用互联网进行实验。

原因

   -cheaper
   -less time consuming

自然实验

经常发生，但不突出

实验方法的优缺点

缺点

人工

  ex. what happens in the experiment may not take place in the real world.

优点

隔离

  ex. the independent and dependent variable are isolated from one another in study. This makes changes easy to spot and
      conclusions to be drawn.

相对容易复制
科学严谨性

伦理与实验

实验涉及误导受试者

实验可能对个人造成潜在的伤害

避免有偏见的内容

一个与偏见有关的问题是缺乏正确的定义。在不同的情况下，如何定义偏见是可以推导出来的。在问卷调查中，偏见是指问卷本身的属性，它鼓励受访者以特定方式回答。例如，“你不同意苹果公司的 CEO 吗？” 会通过促进对苹果公司 CEO 的认同来操纵问题。这种偏见通常会在这个情况下增加支持，但代价是破坏结果。一个例子是

更多支持与更少支持

“遏制犯罪率上升”与“执法”；“处理吸毒成瘾”与“戒毒康复”；“学术资助”与“经济援助”。

进一步促进偏见，社会期望关注问题和答案。在这种情况下，人们更容易以使自己看起来好的答案进行回应。这可能会阻止参与者透露他们真正的想法，尤其是在面对面提问时。为了解决这个问题，提问者应该避免提出让提问者感到尴尬、不人道、变态、愚蠢或社会弱势的问题。提出假设情况也可能引发有偏见的结果，因为受访者会回答一个对他们自己没有直接影响的问题。使用适当或特定的名称也显示出偏见，对男性的积极价值名称比女性多。

实验涉及采取行动，然后观察该行动的结果。实验试图回答这个问题：受试者如何因实验处理而改变？它们从根本上解决因果关系；但是，在实验中建立因果关系并非易事。实验在社会学中很少使用。在社会科学中，它们更常用于社会心理学。它们经常被用于自然科学和医学。

实验通常非常适合涉及有限且定义明确的概念和命题的项目。它们更适合于解释目的，而不是描述目的。

经典实验设计是所有现代实验的基础。这种方法的主要组成部分包括自变量和因变量、前测和后测以及实验组和控制组。

实验研究中的效度问题 - 内部效度是指从实验结果中得出的结论可能无法准确反映实验本身所发生的情况。外部效度是指从实验结果中得出的结论可能无法推广到“现实”世界。

内部效度是指消除对处理效果的替代解释的能力。它实际上是效度和信度问题的结合。内部效度代表着从实验结果中得出的结论可能无法准确反映实验本身发生的可能性。来源包括历史、成熟、测试、仪器、统计回归、选择偏差、实验死亡、因果时间顺序、处理的扩散或模仿、补偿、补偿性竞争和士气低落。经典的实验设计几乎消除了所有对内部效度的威胁。外部效度 - 将实验结果推广到实验本身之外的事件和环境的能力。它代表着从实验结果中得出的结论可能无法推广到“现实”世界的可能性。实验的一个普遍问题是，受试者很少使用概率抽样技术招募。另一个问题是实验环境的人为性。内部效度和外部效度在实验中都非常重要。

经典实验的总结

- 所有现代实验的基础

- 经典实验的主要组成部分

自变量和因变量
前测和后测
实验组和控制组

在社会研究中，实验是一种科学观察模式。实验包括采取行动并观察该行动的结果。对于某些主题和研究目的，实验比其他方法更合适。实验特别适合于涉及相对有限且定义明确的概念和命题的研究项目。由于实验侧重于确定因果关系，因此它们也更适合于解释性目的而不是描述性目的。

最传统的实验类型包括三对主要组成部分：自变量和因变量、前测和后测以及实验组和控制组。实验考察了自变量对因变量的影响。自变量以实验刺激的形式出现，要么存在，要么不存在。实验者比较刺激存在时发生的情况与刺激不存在时发生的情况。为了在实验中使用，自变量和因变量都必须进行操作定义，并且必须在实验开始之前进行操作定义。

在实验设计中，受试者在因变量方面进行测量，称为前测，暴露于代表自变量的刺激，然后在因变量方面再次测量，称为后测。因变量的第一次和最后一次测量之间的任何差异都将归因于自变量。实验组是在实验中施加实验刺激的一组受试者。控制组是在实验中没有施加实验刺激的一组受试者，他们在所有其他方面都应该与实验组相似。在实验结束时对控制组和实验组进行比较，可以说明实验刺激的效果。

前测：对受试者进行因变量的测量

后测：在受试者暴露于自变量后对他们进行因变量的测量。

后测使研究人员能够衡量实验是否改变了某些东西

霍桑效应：受试者在实验中表现得更好

需求特征：受试者试图给出他们认为正确的答案

安慰剂效应：受试者对他们正在接受药物的信念做出反应

实验组：施加实验刺激的一组受试者

控制组：没有施加实验刺激的一组受试者，但在所有其他方面都应该与实验组相似

双盲实验：一种实验设计，其中受试者和实验者都不知道哪个是实验组，哪个是控制组

选择受试者

随机化：将实验受试者分配到实验组和控制组的一种技术
匹配：根据受试者在一个或多个变量上的相似性匹配受试者对的程序，将一对中的一个成员分配到实验组，另一个分配到控制组
配额矩阵：通过找到匹配的受试者对并将一个分配到实验组，另一个分配到控制组来创建实验组和控制组

实验设计的变体

单例个案研究：在实验刺激后对一组受试者进行因变量的测量
单组前测后测设计：为实验组添加了一个前测，但缺少一个控制组
静态组比较：包括实验组和控制组，但没有前测

实验设计中的效度

内部效度：消除对处理效果的替代解释的能力（即效度和信度问题的结合）。内部效度代表着从实验结果中得出的结论可能无法准确反映实验本身发生的可能性。

外部效度：将实验结果推广到实验本身之外的事件和环境的能力。外部效度代表着从实验结果中得出的结论可能无法推广到现实世界。

实验方法的优势

随着时间的推移，隔离实验变量的影响
复制

实验方法的劣势

实验室环境的人为性
成本
伦理

伦理与实验与其他进行社会研究的方法一样，在创建和执行实验时，需要考虑一些伦理问题。1) 欺骗只应在必要时用于研究目的；也就是说，必须确认没有办法避免使用欺骗。此外，欺骗只应在研究的潜在益处超过欺骗受试者的风险时使用。使用欺骗被认为是伦理违规，因此其使用必须是必要的，并且使用欺骗的研究必须有潜力产生有价值的、有暗示性的发现。2) 如果实验在某种程度上对参与者的生活具有侵入性，则应考虑避免对他们造成身体或心理伤害。同样，潜在的价值应超过此类实验侵入的潜在风险。