跳转到内容

R 中的数据挖掘算法/包/RWeka/评估 Weka 分类器

来自 Wikibooks,开放世界中的开放书籍

计算拟合的 Weka 分类器的模型性能统计数据。

evaluate_Weka_classifier(object, newdata = NULL, cost = NULL, numFolds = 0, complexity = FALSE, class = FALSE, seed = NULL, ...)

object,一个 Weka_classifier 对象。

newdata,一个可选的数据框,用于查找用于评估的变量。如果省略或为 NULL,则使用训练实例。

cost,一个 (错) 分类成本的方阵。

numFolds,交叉验证中使用的折叠数。

complexity,选项,用于包含基于熵的统计数据。

class,选项,用于包含类别统计数据。

seed,交叉验证的可选种子。

传递给其他方法的其他参数。

该函数计算并提取一组非冗余的性能统计数据,适用于模型解释。默认情况下,统计数据是在训练数据上计算的。

其他参数仅支持逻辑变量 normalize,它告诉 Weka 规范化成本矩阵,以便正确分类的成本为零。

返回值

[编辑 | 编辑源代码]

一个 Weka_classifier_evaluation 类的对象,包含以下组件的列表

string character,性能统计数据字符串表示形式的连接。

details vector,基本统计数据,例如,正确分类的实例的百分比等。

detailsComplexity vector,基于熵的统计数据。

detailsClass matrix,类别统计数据,例如,每个响应变量级别的真阳性率等。

confusionMatrix table,真实类别和预测类别的交叉分类。

   w <- read.arff(system.file("arff","mytest.arff",package = "RWeka"))
   m <- J48(play~., data = w)
   e <- evaluate_Weka_classifier(m,cost = matrix(c(0,2,1,0), ncol = 2),numFolds = 10, complexity = TRUE,seed = 123, class = TRUE)
华夏公益教科书