R 中的数据挖掘算法/包/RWeka/Weka 分类器懒惰

描述

R 与 Weka 懒惰学习器的接口。

IBk(formula, data, subset, na.action, control = Weka_control(), options = NULL)

LBR(formula, data, subset, na.action, control = Weka_control(), options = NULL)

formula，要拟合的模型的符号描述。

data，可选数据框，包含模型中的变量。

subset，可选向量，指定要用于拟合过程的观测值子集。

na.action，一个函数，指示数据包含 NA 时应该发生什么。

control，一个 Weka_control 类的对象，提供要传递给 Weka 学习器的选项。

options，一个命名列表，包含其他选项，或 NULL（默认值）。

有用于从拟合模型预测的 predict 方法，以及基于 evaluate_Weka_classifier 的 summary 方法。IBk 提供了一个 k 近邻分类器。

LBR（“懒惰贝叶斯规则”）实现了一种懒惰学习方法，以减少朴素贝叶斯的属性独立性假设。模型公式应仅使用“+”和“-”运算符来分别指示要包含或不使用的变量。

参数 options 允许进一步自定义。目前，选项 model 和 instances（或它们的局部匹配）被使用：如果设置为 TRUE，模型框架或相应的 Weka 实例分别包含在拟合的模型对象中，这可能会加快对对象的后续计算。默认情况下，两者都不包含。

一个继承自 Weka_lazy 和 Weka_classifiers 类的列表，包含以下组件

classifier，一个对 Java 对象的引用（jobjRef 类），该对象是通过应用 Weka

buildClassifier，使用给定的控制选项构建指定模型的方法。

predictions，一个数值向量或因子，包含对训练实例的模型预测（使用已构建的分类器和每个实例调用 Weka classifyInstance 方法的结果）。

call，匹配的调用。