R 中的数据挖掘算法/包/RWeka/Weka 分类器规则
R 中对 Weka 规则学习器的接口。
JRip(formula, data, subset, na.action, control = Weka_control(), options = NULL)
M5Rules(formula, data, subset, na.action, control = Weka_control(), options = NULL)
OneR(formula, data, subset, na.action, control = Weka_control(), options = NULL)
PART(formula, data, subset, na.action, control = Weka_control(), options = NULL)
formula,模型拟合的符号描述。
data,可选数据框,包含模型中的变量。
subset,可选向量,指定拟合过程中要使用的观测值子集。
na.action,一个函数,指示当数据包含 NA 时应该发生什么。
control,一个 Weka_control 类对象,用于传递给 Weka 学习器的选项。
options,一个命名列表,包含其他选项,或 NULL(默认)。
存在一个用于预测拟合模型的 predict 方法,以及一个基于 evaluate_Weka_classifier 的 summary 方法。
JRip 实现了一个命题规则学习器,“重复增量剪枝以产生误差减少”(RIPPER),由 Cohen (1995) 提出。
M5Rules 使用分治法为回归问题生成决策列表。在每次迭代中,它使用 M5 构建一个模型树,并将“最佳”叶节点变成一个规则。
OneR 构建一个简单的 1-R 分类器,参见 Holte (1993)。
PART 使用 Frank 和 Witten (1998) 的方法生成 PART 决策列表。
模型公式应该只使用“+”和“-”运算符来分别指示要包含或不包含的变量。参数 options 允许进一步自定义。目前,options model 和 instances(或它们的局部匹配)被使用:如果设置为 TRUE,模型框架或相应的 Weka 实例将被包含在拟合模型对象中,这可能会加速对该对象的后续计算。
一个继承自 Weka_rules 和 Weka_classifiers 类的列表,包含以下组件
classifier,一个对 Java 对象的引用(jobjRef 类),该对象是通过将 Weka buildClassifier 方法应用于使用给定的控制选项构建指定的模型而获得的。
predictions,一个数值向量或因子,包含对训练实例的模型预测(通过对已构建的分类器和每个实例调用 Weka classifyInstance 方法的结果)。
call,匹配的调用。
M5Rules(mpg ~ ., data = mtcars) m <- PART(Species ~ ., data = iris) summary(m)