跳转到内容

R 中的数据挖掘算法/包/RWeka/Weka 分类器规则

来自 Wikibooks,开放的书籍,为开放的世界

R 中对 Weka 规则学习器的接口。

JRip(formula, data, subset, na.action, control = Weka_control(), options = NULL)

M5Rules(formula, data, subset, na.action, control = Weka_control(), options = NULL)

OneR(formula, data, subset, na.action, control = Weka_control(), options = NULL)

PART(formula, data, subset, na.action, control = Weka_control(), options = NULL)

formula,模型拟合的符号描述。

data,可选数据框,包含模型中的变量。

subset,可选向量,指定拟合过程中要使用的观测值子集。

na.action,一个函数,指示当数据包含 NA 时应该发生什么。

control,一个 Weka_control 类对象,用于传递给 Weka 学习器的选项。

options,一个命名列表,包含其他选项,或 NULL(默认)。

存在一个用于预测拟合模型的 predict 方法,以及一个基于 evaluate_Weka_classifier 的 summary 方法。

JRip 实现了一个命题规则学习器,“重复增量剪枝以产生误差减少”(RIPPER),由 Cohen (1995) 提出。

M5Rules 使用分治法为回归问题生成决策列表。在每次迭代中,它使用 M5 构建一个模型树,并将“最佳”叶节点变成一个规则。

OneR 构建一个简单的 1-R 分类器,参见 Holte (1993)。

PART 使用 Frank 和 Witten (1998) 的方法生成 PART 决策列表。

模型公式应该只使用“+”和“-”运算符来分别指示要包含或不包含的变量。参数 options 允许进一步自定义。目前,options model 和 instances(或它们的局部匹配)被使用:如果设置为 TRUE,模型框架或相应的 Weka 实例将被包含在拟合模型对象中,这可能会加速对该对象的后续计算。

返回值

[编辑 | 编辑源代码]

一个继承自 Weka_rules 和 Weka_classifiers 类的列表,包含以下组件

classifier,一个对 Java 对象的引用(jobjRef 类),该对象是通过将 Weka buildClassifier 方法应用于使用给定的控制选项构建指定的模型而获得的。

predictions,一个数值向量或因子,包含对训练实例的模型预测(通过对已构建的分类器和每个实例调用 Weka classifyInstance 方法的结果)。

call,匹配的调用。

   M5Rules(mpg ~ ., data = mtcars)
   m <- PART(Species ~ ., data = iris)
   summary(m)
华夏公益教科书