实验设计食谱/第 9 章:响应面方法
正在分析的数据集包含了 403 名患者的潜在 2 型糖尿病的医疗指标数据。使用响应面方法,实验将测试 4 个因素中的哪些因素表明对 2 型糖尿病发病的易感性,其衡量指标是响应变量,即糖化血红蛋白百分比。世界卫生组织建议使用至少 6.5% 的糖化血红蛋白阈值来确定 2 型糖尿病的存在。由于实验设计(3^k)的性质,需要将 4 个预测变量缩减为三个水平才能用于线性模型。这是通过将小于单个列分位数的值定义为“1”,将大于或等于第一个分位数且小于或等于第三个分位数的值定义为“2”,并将大于第三个分位数的值定义为“3”来完成的。 [1]
以下食谱使用来自 R 包 Ecdat 的数据。该数据集包含美国年轻男性在美国的工资信息。除了工资外,该数据集还包括各种特征,如受教育年限、居住地、职业、种族等。这四个因素被用于响应面方法来检验哪些因素可能有助于解释每小时工资的对数的变化。结果发现,种族和受教育年限都有显著的主效应,而受教育年限和居住地之间的交互作用也显著。找到驻点后,将它们归类为最小值、最大值、脊线、鞍点等。 [2]
以下食谱包含一个实验设计,该设计旨在确定四个解释性因素对甘蔗收获量(吨/公顷)的影响,每个因素具有两个以上水平。一个线性模型将被用来分析区域组、位置、年龄和收获月份的变化是否影响收获甘蔗量的变化。将采用响应面方法来估计残差、系数和方差分析,以分析四个因素的主效应。结果发现,只有收获月份对甘蔗收获量有影响。 <http://rpubs.com/maxwinkelman/46036>
以下食谱演示了正确使用响应面方法来分析四个因素对单个响应变量的影响。本实验分析采用 3^k 设计,并使用 R 包“rsm”进行分析。正在分析的数据集是 2012 年美国的一组犯罪率统计数据。 [3]
本实验旨在分析各种成分对建筑用混凝土混合物整体强度的影响。我们试图通过使用响应面模型进行分析来确定本实验的最优设置。每个因素都具有 4 个以上水平,原假设是,由于这些因素中的任何一个的变化,对混合物强度的影响都没有。然而,从实验结果中,我们拒绝了原假设,因为存在一些显著的主效应和交互作用效应。可以在以下链接中访问此分析:http://rpubs.com/Uzma_1004/45921
以下食谱使用来自 R 包 Ecdat 的数据。该数据集包含 1998-1999 年加利福尼亚州学生成绩的信息。该数据集还提供了许多其他数据列,这些数据可能对进行实验很有用。具体而言,分析了四个因素对分数结果的影响:教师人数、电脑数量、符合减价午餐资格的学生百分比以及地区平均收入。这些因素被用于响应面方法来估计残差、系数和方差分析,以分析四个因素对响应变量,即平均累积考试分数的影响。 http://rpubs.com/macchm/46054
本食谱在分析关于酒后驾车和死亡率的数据集时,使用响应面方法。使用 4 个因素(啤酒税、最低饮酒年龄、平均行驶里程和失业率),每个因素有 3 个水平,创建了一个线性模型,并使用响应面方法来执行方差分析,以及确定具有最佳响应变量(最小值或最大值)的驻点。 [4]
以下食谱是关于电脑价格和可能解释价格差异的因素。在本分析中,我们创建了一个线性模型,并使用响应面方法来测试选定的因素如何影响电脑价格。选定的因素是:以 MHz 为单位的时钟速度 (speed)、以 MB 为单位的硬盘大小 (hd)、以 MB 为单位的内存大小 (ram) 以及以英寸为单位的屏幕大小 (screen)。使用这四个因素构建一个包含二阶效应的线性模型,然后使用“rsm”进行参数估计,并分析不同响应面图中的驻点。 http://rpubs.com/chenh16/46081
在本研究中,我们使用响应面方法来检验“克拉”、“颜色”、“净度”和“证书”对新加坡钻石价格的影响,并使用该方法确定最佳状态。结果表明,钻石石价格的变化不仅是由样本随机化造成的,而且还分析了所选变量的主效应、双向交互作用效应和纯二次效应。在最佳价格分析中,获得了鞍点,没有找到局部最大值/最小值。 [5]
在本研究中,进行了四因素多水平实验,以查看某个团队在某个赛季获得的击球数('H')、本垒打数('HR')、三振出局数('SO')或保送数('BB')是否对该团队在某个赛季获得的失利数('L')有统计学意义的影响(这是本分析的响应变量)。执行方差分析 (ANOVA) 作为一种方法来确定这些因素对响应变量 'L' 的重要性,并且使用响应面方法来确定响应变量 'L' 的最佳操作特性(因为它与线性模型相对应)与它 的二阶响应面及其驻点的表征。 [6]
本食谱正在检查来自 Ecdat 包的 C's of diamond stones 数据集的定价。我们正在查看 4 个不同的因素,每个因素都有 2 个或更多个水平,它们如何影响新加坡的价格。此方法用于建模和分析响应变量(钻石价格)受到多个变量(克拉、颜色、净度、证书)影响的问题,目标是优化此响应。从响应面方法,我们可以找到是否存在任何最大值、最小值、鞍点或脊线。 - Cheryl Tran http://rpubs.com/tranc3/46123
以下食谱检查了来自 Ecdat 包的 Computers 数据集。响应面方法用于确定四个因素对电脑价格的影响,这四个因素具有 3 个或更多个水平,即硬盘大小、屏幕大小、内存大小和速度。因素水平被操纵,以便可以使用响应面方法。目标是确定电脑速度和屏幕、内存和硬盘大小是否可以通过方差分析来解释速度的变化。与往常一样,执行统计分析,检查模型充分性,并讨论意外情况。 [7]
2016 年项目
Bjarke H 本实验分析了来自 Ecdat 包的 Star 数据集。主要重点是使用项目 3 中的模型进行响应面方法,以及添加连续变量。响应面是使用 RSM 包计算的。 http://rpubs.com/bjarke1/project4
Cole K 本食谱分析了来自 Ecdat 包的 Housing 数据集。Housing 数据集查看了温莎的房屋销售价格。这是一个包含 1987 年横截面的数据集,共有 546 个观测值。本食谱的目标是在 R 中使用 RSM 包来优化在第 7 章:分数因子方法中创建的模型。这是通过使用等高线图和透视图进行可视化来完成的,然后检查模型的充分性。 http://rpubs.com/Kristencole3/235877
Deshpande R 本分析侧重于了解学生的不同属性如何影响他们的学校出勤率。数据集包含 2008 年葡萄牙 649 名学生的 30 个属性,但实验侧重于性别、课外活动参与、饮酒和到校时间。本研究使用 RSM 技术分析了这四个自变量对缺勤次数的影响。分析考察了主效应、双因素交互作用和纯二次项。等高线图和可视化也用于理解 RSM 结果。 http://rpubs.com/rajanideshpande/235909
Trevor C. 本食谱分析了 Motor Trend 数据,该数据突出了汽车的性能和设计因素。一些主要因素是发动机类型、变速箱类型、汽车重量和气缸数量。使用 RSM 技术研究了这些因素的影响,主要分析主效应和双因素交互作用效应。我们使用分数因子设计和线性方差分析设计作为基线方法。提供了等高线图和透视图以帮助读者可视化和理解数据以及所执行的分析。 http://rpubs.com/trevorcorrao/235911
Benjamin B. 该项目研究了包含 93 个观测值的汽车数据集。首先,使用部分因子设计,研究了哪些因素会影响价格。有两个 2 水平因素和两个 3 水平因素,这些因素被分解成 2 水平因素。这些因素包括安全气囊、驱动、手动变速器和产地。然后,根据别名结构、主效应、交互效应和方差分析分析结果。接下来,在检查了主效应、别名和方差分析结果后,建立了模型。使用该模型,还将案例扩展到响应面方法。结果与预期一致,其中驱动、手动变速器和产地对汽车价格的影响最大。部分因子设计和响应面方法的结果一致。 http://rpubs.com/byeonb/doeproject4_ver1 [8]
- ↑ Trevor Manzanares http://rpubs.com/manzat/45910
- ↑ Jane Braun http://rpubs.com/braunj6/46024
- ↑ Anthony D'Amato http://rpubs.com/adamato/46049
- ↑ http://rpubs.com/Tothk2/Recipe9
- ↑ Wei Zou http://rpubs.com/serena049/doehw09
- ↑ Brendan Howell http://rpubs.com/howelb/46118
- ↑ Ali Svoboda- http://rpubs.com/svoboa/46230
- ↑ Benjamin B. http://rpubs.com/byeonb/doeproject4_ver1