跳转到内容

实验设计食谱/第 6 章:协方差分析

来自维基教科书,开放的书籍,开放的世界

第 6 章:协方差分析

在本食谱中,将分析从 "iris.csv" 中获取的数据。协方差分析 (ANCOVA) 将评估因变量花瓣面积 (cm^2) 的均值是否在自变量类别变量物种的所有水平上相等,同时控制连续解释变量萼片面积 (cm^2) 和花瓣比率的影响。 http://rpubs.com/maxwinkelman/38440

在本研究中,我们设计了一个实验来调查 1985 年至 1995 年美国香烟消费的影响因素。为此,我们使用了 R 中 “Ecdat” 包下的数据集 “Cigarette”,并检查平均税收、州个人收入或州的变化是否会影响人均香烟消费的变化。Wei Zou http://rpubs.com/serena049/hw6

在本项目中,分析的数据集包含 1960 年至 2012 年美国犯罪率数据。本实验将试图了解哪些因素会影响这些年份的总犯罪率。协方差分析用于确定交互效应以及人口、暴力犯罪数量和抢劫因素水平对响应变量“总犯罪数量”的个体因素效应。 [1]

本食谱重点介绍协方差分析的应用。数据来自福布斯 500 强榜单,包括约 79 家公司。感兴趣的响应变量是特定公司拥有的资产数量,而连续自变量是利润、现金流和市值。感兴趣的“处理”是不同的市场部门。结果发现,数据不是正态分布,因此完成多次变换以更好地拟合数据。 http://rpubs.com/braunj6/38436

以下食谱是对涉及美国香烟销售的数据集进行协方差分析。该研究收集了 1985 年至 1992 年在美国的数据,并记录了该州的人口统计数据以及该州和年份的价格和消费者物价指数。本分析旨在分析人均可支配收入因素对人均销售量(按包计算)的影响。由于这是协方差分析,我们还使用两个连续的解释变量,即每包香烟的价格和相邻州的香烟最低价格,以提高分析的精度。 http://rpubs.com/Tothk2/Recipe6

本实验的目的是研究用于制造混凝土的超级塑化剂的用量,这取决于混凝土混合物的总龄期(以天为单位)。分析使用强度(以 MPa 为单位)和混合物中使用的水量作为解释变量(无法控制)。实质上,我们试图比较使用的不同超级塑化剂数量(m^3 混合物中 kg),以及它们对混合物总龄期的影响。现在,已知强度和水量会受到制造混凝土混合物时所使用的超级塑化剂比例的影响,但我们想看看它对混合物龄期(以天为单位)的影响。对于本分析,我们使用协方差分析 (ANCOVA) 技术。整个分析可以在以下位置访问: http://rpubs.com/Uzma_1004/38452

以下实验设计食谱是正确使用协方差分析 (ANCOVA) 的示例,用于监控两个不可控连续变量以及一个分类值对单个响应变量的影响。本食谱中使用的数据是不同花卉物种的花萼长度和花瓣长度的测量值集合。 http://rpubs.com/adamato/39072

以下实验对 R 中 Edcat 包中的 Computers 数据集进行协方差分析 (ANCOVA)。目标是检查计算机速度、硬盘大小和屏幕尺寸是否被测试以查看它们是否可以解释计算机价格的变量。创建了一个线性模型,执行了 ANCOVA 和 Tukey 测试,检查了模型的充分性,并讨论了未满足假设的可能性。 [2]

在本分析中,我们查看了 R 中 Edcat 包内的 Cigars 数据集。分析着眼于香烟销售量与解释变量之间的方差关系 - 消费者物价指数 (CPI)、相邻州每包香烟的最低价格以及 16 岁以上的人口。进行了 ANCOVA 测试,发现我们拒绝了三个解释变量对响应变量没有显著差异的零假设。 http://rpubs.com/hsiac/38495

以下食谱是协方差分析的示例。在这里,我们从 R 包 “Edcat” 中选择数据集,统计数据是关于西班牙家庭的食物预算份额。我们调查了人们居住的城镇规模如何影响在食物上的总支出百分比,其中参考人的年龄和家庭的总支出是独立的解释变量。通过 ANCOVA,我们可以了解解释变量和单个因素如何共同影响响应变量。包括探索性数据分析、ANCOVA 测试和模型充分性检查。 http://rpubs.com/chenh16/38460

在本研究中,将执行单因素多水平实验(使用 Lahman's Baseball Database)以查看特定团队在特定赛季中获得的击球数 ('H') 是否对特定团队在特定赛季中获得的失球数 ('L') 具有统计学意义的影响 [这是分析考虑的响应变量]。除了分析处理 'H' 之外,这里还考虑了两个解释变量。这些解释变量指的是特定团队在特定赛季中获得的总三振出局数 ('SO') 以及特定团队在特定赛季中的自责失分率 ('ERA')。在确定此显著性水平时,将执行 ANCOVA 分析,计算 Tukey 诚实显著差异,并验证建模假设。 [3]

本食谱正在检查 Ecdat 包中的船舶事故。使用此数据集,我们正在测试一个因素和 2 个解释变量对单个响应变量事故的影响。 http://rpubs.com/tranc3/38470

本食谱是对 Ecdat 包中的 Airq 数据集的研究。本食谱重点介绍协方差分析的应用。所检查的响应变量是关于加州大都市区的空气质量水平。连续自变量是降雨量、增加值和人口密度。感兴趣的因素是测量的不同位置,以及它们是否来自沿海地区。 http://rpubs.com/macchm/38477

以下协方差分析使用双因素 ANCOVA 检查地理区域对全球亿万富翁财富的影响,其中使用亿万富翁的年龄作为协变量。 [4]


参考文献

[编辑 | 编辑源代码]
华夏公益教科书