跳转到内容

R 中的数据挖掘算法/包/RWeka/Weka 分类器函数

来自维基教科书,开放的书籍,开放的世界

R 接口到 Weka 回归和分类函数学习器。

LinearRegression(formula, data, subset, na.action, control = Weka_control(), options = NULL)

Logistic(formula, data, subset, na.action, control = Weka_control(), options = NULL)

SMO(formula, data, subset, na.action, control = Weka_control(), options = NULL)

formula,要拟合模型的符号描述。

data,可选的数据框,包含模型中的变量。

subset,可选的向量,指定拟合过程中要使用的观测子集。

na.action,一个函数,指示当数据包含 NA 时应该发生什么。

control,一个 Weka_control 类对象,用于传递给 Weka 学习器的选项。

options,一个命名的进一步选项列表,或 NULL(默认)。

存在用于从拟合模型预测的 predict 方法,以及基于 evaluate_Weka_classifier 的 summary 方法。LinearRegression 使用 Akaike 准则进行模型选择,构建合适的线性回归模型。Logistic 基于岭估计构建多项式逻辑回归模型。SMO 实现 John C. Platt 的序列最小优化算法,使用多项式或 RBF 核训练支持向量分类器。多类问题通过成对分类解决。

模型公式应仅使用“+”和“-”运算符分别指示要包含或不包含的变量。参数 options 允许进一步自定义。目前,选项 model 和 instances(或这些选项的部分匹配)被使用:如果设置为 TRUE,则模型框架或相应的 Weka 实例将分别包含在拟合模型对象中,这可能会加快对该对象的后续计算。

返回值

[编辑 | 编辑源代码]

一个继承自 Weka_functions 和 Weka_classifiers 类的列表,其组件包括:classifier,一个对 Java 对象的引用(jobjRef 类),该对象是通过将 Weka buildClassifier 方法应用于使用给定的控制选项构建指定模型而获得的。

predictions,一个数值向量或因子,包含训练实例的模型预测(对构建的分类器和每个实例调用 Weka classifyInstance 方法的结果)。

call,匹配的调用。

   LinearRegression(mpg ~ ., data = mtcars)
   step(lm(mpg ~ ., data = mtcars), trace = 0)
   LinearRegression(weight ~ feed, data = chickwts)
   STATUS <- factor(infert$case, labels = c("control", "case"))
   Logistic(STATUS ~ spontaneous + induced, data = infert)
   glm(STATUS ~ spontaneous + induced, data = infert, family = binomial())
   SMO(Species ~ ., data = iris, control = Weka_control(K = list("weka.classifiers.functions.supportVector.RBFKernel", G = 2)))
   SMO(Species ~ ., data = iris, control = Weka_control(K = list("RBFKernel", G = 2)))
华夏公益教科书