R 中的数据挖掘算法/包/RWeka/Weka 分类器函数
R 接口到 Weka 回归和分类函数学习器。
LinearRegression(formula, data, subset, na.action, control = Weka_control(), options = NULL)
Logistic(formula, data, subset, na.action, control = Weka_control(), options = NULL)
SMO(formula, data, subset, na.action, control = Weka_control(), options = NULL)
formula,要拟合模型的符号描述。
data,可选的数据框,包含模型中的变量。
subset,可选的向量,指定拟合过程中要使用的观测子集。
na.action,一个函数,指示当数据包含 NA 时应该发生什么。
control,一个 Weka_control 类对象,用于传递给 Weka 学习器的选项。
options,一个命名的进一步选项列表,或 NULL(默认)。
存在用于从拟合模型预测的 predict 方法,以及基于 evaluate_Weka_classifier 的 summary 方法。LinearRegression 使用 Akaike 准则进行模型选择,构建合适的线性回归模型。Logistic 基于岭估计构建多项式逻辑回归模型。SMO 实现 John C. Platt 的序列最小优化算法,使用多项式或 RBF 核训练支持向量分类器。多类问题通过成对分类解决。
模型公式应仅使用“+”和“-”运算符分别指示要包含或不包含的变量。参数 options 允许进一步自定义。目前,选项 model 和 instances(或这些选项的部分匹配)被使用:如果设置为 TRUE,则模型框架或相应的 Weka 实例将分别包含在拟合模型对象中,这可能会加快对该对象的后续计算。
一个继承自 Weka_functions 和 Weka_classifiers 类的列表,其组件包括:classifier,一个对 Java 对象的引用(jobjRef 类),该对象是通过将 Weka buildClassifier 方法应用于使用给定的控制选项构建指定模型而获得的。
predictions,一个数值向量或因子,包含训练实例的模型预测(对构建的分类器和每个实例调用 Weka classifyInstance 方法的结果)。
call,匹配的调用。
LinearRegression(mpg ~ ., data = mtcars) step(lm(mpg ~ ., data = mtcars), trace = 0) LinearRegression(weight ~ feed, data = chickwts) STATUS <- factor(infert$case, labels = c("control", "case")) Logistic(STATUS ~ spontaneous + induced, data = infert) glm(STATUS ~ spontaneous + induced, data = infert, family = binomial()) SMO(Species ~ ., data = iris, control = Weka_control(K = list("weka.classifiers.functions.supportVector.RBFKernel", G = 2))) SMO(Species ~ ., data = iris, control = Weka_control(K = list("RBFKernel", G = 2)))