R 中的数据挖掘算法/包/RWeka/Weka 分类器函数

描述

R 接口到 Weka 回归和分类函数学习器。

用法

LinearRegression(formula, data, subset, na.action, control = Weka_control(), options = NULL)

Logistic(formula, data, subset, na.action, control = Weka_control(), options = NULL)

SMO(formula, data, subset, na.action, control = Weka_control(), options = NULL)

参数

formula，要拟合模型的符号描述。

data，可选的数据框，包含模型中的变量。

subset，可选的向量，指定拟合过程中要使用的观测子集。

na.action，一个函数，指示当数据包含 NA 时应该发生什么。

control，一个 Weka_control 类对象，用于传递给 Weka 学习器的选项。

options，一个命名的进一步选项列表，或 NULL（默认）。

细节

存在用于从拟合模型预测的 predict 方法，以及基于 evaluate_Weka_classifier 的 summary 方法。LinearRegression 使用 Akaike 准则进行模型选择，构建合适的线性回归模型。Logistic 基于岭估计构建多项式逻辑回归模型。SMO 实现 John C. Platt 的序列最小优化算法，使用多项式或 RBF 核训练支持向量分类器。多类问题通过成对分类解决。

模型公式应仅使用“+”和“-”运算符分别指示要包含或不包含的变量。参数 options 允许进一步自定义。目前，选项 model 和 instances（或这些选项的部分匹配）被使用：如果设置为 TRUE，则模型框架或相应的 Weka 实例将分别包含在拟合模型对象中，这可能会加快对该对象的后续计算。

返回值

一个继承自 Weka_functions 和 Weka_classifiers 类的列表，其组件包括：classifier，一个对 Java 对象的引用（jobjRef 类），该对象是通过将 Weka buildClassifier 方法应用于使用给定的控制选项构建指定模型而获得的。

predictions，一个数值向量或因子，包含训练实例的模型预测（对构建的分类器和每个实例调用 Weka classifyInstance 方法的结果）。

call，匹配的调用。

示例

   LinearRegression(mpg ~ ., data = mtcars)
   step(lm(mpg ~ ., data = mtcars), trace = 0)
   LinearRegression(weight ~ feed, data = chickwts)
   STATUS <- factor(infert$case, labels = c("control", "case"))
   Logistic(STATUS ~ spontaneous + induced, data = infert)
   glm(STATUS ~ spontaneous + induced, data = infert, family = binomial())
   SMO(Species ~ ., data = iris, control = Weka_control(K = list("weka.classifiers.functions.supportVector.RBFKernel", G = 2)))
   SMO(Species ~ ., data = iris, control = Weka_control(K = list("RBFKernel", G = 2)))