R 中的数据挖掘算法/包/RWeka/评估 Weka 分类器
外观
计算拟合的 Weka 分类器的模型性能统计数据。
evaluate_Weka_classifier(object, newdata = NULL, cost = NULL, numFolds = 0, complexity = FALSE, class = FALSE, seed = NULL, ...)
object,一个 Weka_classifier 对象。
newdata,一个可选的数据框,用于查找用于评估的变量。如果省略或为 NULL,则使用训练实例。
cost,一个 (错) 分类成本的方阵。
numFolds,交叉验证中使用的折叠数。
complexity,选项,用于包含基于熵的统计数据。
class,选项,用于包含类别统计数据。
seed,交叉验证的可选种子。
传递给其他方法的其他参数。
该函数计算并提取一组非冗余的性能统计数据,适用于模型解释。默认情况下,统计数据是在训练数据上计算的。
其他参数仅支持逻辑变量 normalize,它告诉 Weka 规范化成本矩阵,以便正确分类的成本为零。
一个 Weka_classifier_evaluation 类的对象,包含以下组件的列表
string character,性能统计数据字符串表示形式的连接。
details vector,基本统计数据,例如,正确分类的实例的百分比等。
detailsComplexity vector,基于熵的统计数据。
detailsClass matrix,类别统计数据,例如,每个响应变量级别的真阳性率等。
confusionMatrix table,真实类别和预测类别的交叉分类。
w <- read.arff(system.file("arff","mytest.arff",package = "RWeka")) m <- J48(play~., data = w) e <- evaluate_Weka_classifier(m,cost = matrix(c(0,2,1,0), ncol = 2),numFolds = 10, complexity = TRUE,seed = 123, class = TRUE)