跳转至内容

R 中的数据挖掘算法/包/RWeka/Weka 分类器懒惰

来自维基教科书,开放的书籍,开放的世界

R 与 Weka 懒惰学习器的接口。

IBk(formula, data, subset, na.action, control = Weka_control(), options = NULL)

LBR(formula, data, subset, na.action, control = Weka_control(), options = NULL)

formula,要拟合的模型的符号描述。

data,可选数据框,包含模型中的变量。

subset,可选向量,指定要用于拟合过程的观测值子集。

na.action,一个函数,指示数据包含 NA 时应该发生什么。

control,一个 Weka_control 类的对象,提供要传递给 Weka 学习器的选项。

options,一个命名列表,包含其他选项,或 NULL(默认值)。

有用于从拟合模型预测的 predict 方法,以及基于 evaluate_Weka_classifier 的 summary 方法。IBk 提供了一个 k 近邻分类器。

LBR(“懒惰贝叶斯规则”)实现了一种懒惰学习方法,以减少朴素贝叶斯的属性独立性假设。模型公式应仅使用“+”和“-”运算符来分别指示要包含或不使用的变量。

参数 options 允许进一步自定义。目前,选项 model 和 instances(或它们的局部匹配)被使用:如果设置为 TRUE,模型框架或相应的 Weka 实例分别包含在拟合的模型对象中,这可能会加快对对象的后续计算。默认情况下,两者都不包含。

一个继承自 Weka_lazy 和 Weka_classifiers 类的列表,包含以下组件

classifier,一个对 Java 对象的引用(jobjRef 类),该对象是通过应用 Weka

buildClassifier,使用给定的控制选项构建指定模型的方法。

predictions,一个数值向量或因子,包含对训练实例的模型预测(使用已构建的分类器和每个实例调用 Weka classifyInstance 方法的结果)。

call,匹配的调用。

华夏公益教科书