跳转到内容

实验设计食谱/第7章:重采样方法

来自维基教科书,开放书籍,开放世界

正在分析的数据集是美国农业部标准参考国家营养数据库的第 27 版。其中包含 8,618 种不同的食物,但为了进行方差分析,该列表将根据食物名称的首字母缩写为 25 个级别。请注意,没有食物名称以字母“X”开头。ANOVA 用于确定食物的 Short_Description 对该食物的蛋白质含量(克)的影响。然后使用自举法和蒙特卡罗模拟进行重采样,以克服正态性的限制性假设。[1]


以下分析是在关于婚外情的数据集上执行的一次因子 ANOVA。数据集包含 601 个条目,旨在确定宗教和一个人有多虔诚是否会影响他们婚外情的数量。实验分为两个部分,第一部分是使用线性模型的常规 ANOVA,第二部分涉及使用蒙特卡罗模拟和自举法进行重采样,以执行二次 ANOVA 检验。[2]


此分析是针对提供少数民族在计算机科学考试中表现的数据集进行的一次因子多级 ANOVA。从初始结果(ANOVA 测试)中,我们决定了重采样技术,并再次对模拟数据执行 ANOVA。发现适用于此实验的重采样技术是“自举法”。初始数据集和自举版本的結果均未能拒绝实验问题设置在分析开始时所提出的零假设。[3]


此食谱中将进行的实验旨在确定 NFL 球员体重的变化是否可以归因于 NFL 球队的变化。将执行具有 95% 置信区间的方差分析,以确定球员所属的球队是否会影响其体重。在执行 ANOVA 后,将实施“蒙特卡罗”模拟和自举法,以确定重采样的影响。[4]


此实验设计食谱使用包含美国犯罪率的数据集,以演示如何正确使用重采样技术来确定用于方差分析 (ANOVA) 的数据集的实际分布。这样做,ANOVA 的结果更准确,因为该测试不依赖于其固有的正态性假设。[5]


此食谱正在检查 Ecdat 包中西班牙家庭的食物预算份额。使用此数据集,我们正在测试具有多个级别的单个因子的单一响应变量模型。[6]


以下测试是关于计算机大小对计算机价格的影响。在此测试中,我们使用 ANOVA 来调查价格的方差是否可以解释为屏幕尺寸的方差。为了使用更计算的方法来仔细检查 ANOVA 的有效性并提高其准确性,我们使用了 Bootstrap 重采样技术。事实证明,分析和理论 F 分布与基于所用数据和重采样的 ANOVA 非常不同,表明数据可能不是正态分布的。[7]


以下食谱分析了美国失业数据,以及失业的各种原因如何解释响应变量的变化 - 失业持续时间(以周为单位)。此食谱使用了一路四级方差分析 (ANOVA)。还使用了各种重采样技术来评估模型的充分性。[8]


以下分析是在船舶事故数据集中进行的。对单个响应执行了一因子多级 ANOVA 检验。自举法被用作重采样技术来检查模型的充分性。[9]


在本研究中,使用 [使用“Benefits”数据框(嵌套在名为“Ecdat”的 R 包中)包含有关名为“失业保险福利水平对领取的影响”的研究出版物的相关数据(McCall, B.P. 1995)] 执行了一因子多级实验,以查看与蓝领工人失业原因相关的因素是否对州失业率(以 % 为单位)具有统计学意义。在数据集中,因素“joblost”指的是蓝领工人失业的原因。此外,此分析的响应变量在数据集中被称为“stateur”,它表示分析中的州失业率。在确定此显着性水平时,执行 ANOVA 分析(带和不带通过自举进行的重采样)并计算 Tukey 诚实显著差异。[10]


在此食谱中,对 Ecdat 数据包中的 Earnings 数据集进行了分析。为了执行此分析,执行 ANOVA 分析(带和不带通过自举进行的重采样)。[11]


此食谱的目的是使用重采样方法重复 ANOVA 并比较结果。用于此实验的数据集是 R 中“Ecdat 包”中的“Star”,用于探索小班规模对学习的影响。在本研究中,我们重点关注班级类型对学生数学总分的影响。对原始数据和重新采样数据(通过自举法)执行 ANOVA,并证明结果是一致的。[12]


以下食谱检查了来自 Edcat 包名称的 Crime 数据集,该数据集位于 100 多个有趣数据集网页列表中。检查北卡罗来纳州的地区,以查看它们是否可以解释一次因子多级 ANOVA 中犯罪率的变化。还执行了重采样 (蒙特卡罗和自举) ANOVA,然后检查了模型的充分性。还讨论了模型假设被打破时的意外情况。[13]


以下分析使用单因子 ANOVA 和重采样来检查纽约合唱团四种声部中平均歌手身高(以英寸为单位)的变化。[14]


1998-1999 年的加州测试成绩数据集被用于比较不同年级跨度(K-6 或 K-8)地区的学生人均支出。数据按县进行分组,以减少可能发生在州不同地区之间地区的社会经济差异的影响。一个用于计算 Cohen's d 的函数被用来选择响应变量。G*Power 软件被用来生成 alpha = 0.05 和 power = 0.9 的理想样本量。使用此样本量的 ANOVA 显示样本之间存在统计学上的显著差异,但结果被证明不稳健,因为违反了数据的正态性假设。使用了两种替代零假设统计检验的方法:重采样和绘图加误差条,来分析数据。[15]

此食谱分析了工会代表对 1980-1987 年受雇于 12 个行业中的年轻男性工人的时薪的影响。由于行业可能会影响工资,因此该因素在 ANOVA 测试中被阻塞。这导致使用随机不完全区组设计来确定和分析工会代表主要影响的显著性。使用了 50 的样本量,以及 0.05 的 alpha 和 0.05 的 beta。ANOVA 测试输出给出了一个 p 值,表明两个组(工会和非工会代表)之间存在统计学上的显著差异。此外,还使用了两种替代零假设统计检验 (NHST) 的方法。使用 t 统计量和效应量进行重采样,并计算显著性区间,以帮助验证和证实 NHST 的结论。[16]

(KU) BudgetFood,从 Ecdat 包中选择,代表了 1980 年“西班牙家庭食物预算份额”的横截面,而数据的来源主要来自应用计量经济学杂志。家庭在食品上花费的总支出的百分比是数据集的连续响应变量。参考人的性别(收入所有者)被选为自变量,并且该因素用城镇规模变量进行分组。此设计的零假设将是:“家庭在食品上花费的总支出百分比不受参考人性别的影响。”为了检验我们的零假设,首先使用 G*Power 定义样本量,并且已根据计算的样本量随机重新组织数据以创建平衡设计。已经执行了 ANOVA,并且在置信区间和重新采样方法被用作零假设统计检验的替代方法后。[17]

(MR) Housing 数据集,在 Ecdat 包中找到,显示了有关房价的数据 - 实际售价、卧室和浴室的数量、房屋是否有车道以及房屋是否位于城镇的“首选区域”,仅举几例。进行了分析以确定是否有车道对房屋售价的影响,并按房屋是否位于城镇的“首选区域”进行分组。零假设是车道或区域对房屋售价没有影响。这首先使用 ANOVA 进行检查,然后实施了重采样技术,然后使用 G*Power 进行功效分析。[18]

(M Wassick) 来自 Ecdat 包的 Star 数据框是对学习进行的一项研究,该研究取自 1985-1989 年对班级风格对学习影响的研究。学习通过测试分数进行评估,并根据各种因素进行分析。此分析将使用分组变量sex和测试变量classk,即班级风格。班级风格对学生成绩的影响将通过多种方式进行测试。首先,将使用零假设进行 ANOVA,即 classk 对成绩没有影响,备择假设是班级风格对学生成绩有显著影响。此外,将使用 CI 评估和自举 ANOVA 分析对假设进行测试和佐证。[19]

(Y Ding) 本实验使用 R 语言中的 “Ecdat” 包中的数据。这是一个数据框,包含 60 种汽车的里程数和品牌国家等参数。本实验的目的是测试汽车价格随里程数变化的变动情况。里程数和国家是分类的独立变量,而因变量价格是连续的。实验执行是随机的,干扰因素(国家)被阻断。为了节省时间和开支,我们在实验中使用了一个样本量,足以获得里程数的影响大小。在里程数对汽车价格没有影响的零假设下,我们进行了不同的分析,假设数据中的误差服从正态分布。然而,根据结果,我们基于该假设的分析可能不准确,应该考虑另一个模型。 [20]

(DR) 一项基于温莎市住房数据的研究被用于测试影响城市地区房屋销售价格的因素。使用了零假设检验技术,其中响应变量是价格。研究中分析了两个因素:浴室数量和社区偏好。置信区间和重抽样技术被用作替代方案,以检测不同浴室数量组之间的显著差异。选择的显著性水平为 0.05,功效为 0.90。结果表明,当从 1、2 或 3 个浴室改变时,房屋价格存在显著差异。 [21]

(LZ) 在本研究中,我们使用包含来自美国 1993 年至 1995 年的 6259 个观测值的数据。该数据集中包含的价格、硬件状况、制造商等信息。我们的主要目的是测试 CD-ROM 安装是否对价格有显著影响。我们在分析中使用了阻断。我们认为屏幕尺寸不是影响价格的主要因素,我们对这个因素不感兴趣,所以样本被屏幕尺寸阻断。通过设置 alpha=0.05 和 beta=0.05,我们生成了 84 个样本量。方差分析表明,根据我们选择的样本,存在显著差异。最后,我们使用两种替代方法来测试结果。 [22]

(MS) 在这个例子中,我们使用了包含来自 1976 年至 1872 年的 4165 个观测值的数据。该数据集中包含的对数工资、工会工人、婚姻状况、性别、个人是否为黑人等信息。我们的主要目的是测试个人是否为黑人对对数工资有显著影响。分析中使用了阻断。还使用了方差分析、重抽样和效应量。 [23]

(Bok, Joonhyuk) 在 Ecdat R 包中的一个数据集里,我们选择了“Diamond”,它可以用来预测和计算钻石价格。在 Diamond 数据中,'colour' 和 'clarity' 被选为因素,分别代表钻石的特性,分别有 6 个级别和 5 个级别。我们选择 'price' 作为响应变量。在选择了一些分类的独立变量和一个连续的响应变量后,我们对未阻断的独立变量 colour 进行了零假设统计检验实验。将使用随机不完全区组设计来研究颜色对价格的影响。将使用两个因素的方差分析来分析颜色在阻断清晰度时的影响。因此,我们只考虑主效应,不考虑交互效应。此外,我们利用 G*Power 来确定样本量,假设 Alpha=0.05、Beta=0.05、功效=1-Beta=0.95 和效应量=0.03467091。除了零假设统计检验 (NHST) 之外,我们还将进行替代评估、重抽样统计和置信区间。 [24]

(SW) 欧洲共同体家庭面板于 1994 年对比利时的时薪进行了研究。比利时工资数据集包含 1472 个个人的观测值,包括时薪、教育水平、工作经验年限和性别等信息。我选择的两个分类独立变量 (IV) 是 **性别** 和 **educ**,分别代表个人的性别和教育水平。连续的因变量 (DV) 或响应变量是 **wage**,代表时薪。该分析使用阻断变量 **educ**,即教育水平。这样做是为了消除可能来自不同教育水平个体之间工资差异的噪音。将使用多种方法测试性别对时薪的影响。首先,将使用零假设(男性和女性的工资之间没有显著差异)进行方差分析。此外,重抽样统计和绘图加误差条程序被用作 NHST 的替代方案。 [25]

(AZ) 本研究分析了 1929 年至 1947 年按行业和年份划分的公司利润数据。数据来自经济分析局,以十亿美元表示。在本实验中,两个因素(分类的独立变量)是行业和年份,而连续的因变量是公司利润。行业包含 12 个不同的级别:经调整的公司利润、金融、非金融、世界其他地区、联邦储备银行、其他、制造业、耐用品、非耐用品、运输和公用事业以及批发贸易零售贸易汽车。年份包含 19 个级别(从 1929 年到 1947 年的每一年)。本实验使用随机区组设计。一个变量(年份)将被阻断,假设将在第二个变量(行业)上进行检验。首先将进行箱线图探索性分析。将进行方差分析,以及零假设统计检验的替代方案:置信区间和重抽样。实验将以模型验证结束。 [26]

(AV) 来自 ecdat 包中与婚外情有关的数据集。1977 年耶鲁大学进行的一项研究收集了 601 个观测值。因素包括性别、个人是否有孩子、宗教信仰、年龄、婚姻年限等等。实验考察了两个独立变量,并使用了阻断。G*Power 用于确定样本量,蒙特卡罗模拟用于随机化和统计重抽样。Tukey 检验是 NHST 的另一个替代方案。Cohen 的 D 也用于确定效应量。 [27]

(FO) 观察婚外情的数据,我们进行了测试,以查看婚姻自我“评分”对“婚外情次数”的影响,同时针对“孩子”这一单独因素进行阻断。本研究使用方差分析来检验假设,然后考察研究方差分析结果的重要性。在此之后,展示了替代假设检验,并进行了分析,以确定该因素是否确实对因变量产生了影响。 [28]

(PD) 用于本项目的数据是 R 的 Ecdat 包中的 VietNamH 数据集。该数据描述了越南家庭的总支出、医疗支出和食品支出。为了进行我们的分析,我们选择的响应变量是“总支出”,我们选择的两个独立变量是家庭主人的性别(男性、女性)和家庭是否位于城市或非城市地区。事实证明,家庭是否位于城市或非城市地区对家庭支出有显著影响。另一方面,家庭主人的性别似乎没有显著影响。 [29]

(TE) 本研究分析了美国 42 个州过去 20 年的香烟销售数据。我们评估了年份和地区这两个因素对以每人香烟盒数衡量的销售量的影响。我们使用方差分析以及假设检验来估计主效应。我们验证了模型的充分性,并通过蒙特卡罗模拟进行重抽样以控制正态性假设。结果表明,地理位置对香烟销售有显著影响。 [30]

参考文献

[edit | edit source]

28. A. Ziemba http://rpubs.com/ziemba/225886 29. P. Date http://rpubs.com/prasanna_date/225890

华夏公益教科书