R 中的数据挖掘算法/包/RWeka/Weka 聚类器
外观
R 对 Weka 聚类算法的接口。
Cobweb(x, control = NULL)
FarthestFirst(x, control = NULL)
SimpleKMeans(x, control = NULL)
XMeans(x, control = NULL)
DBScan(x, control = NULL)
x,一个包含要聚类的数据的 R 对象。
control,一个 Weka_control 类对象,或一个控制选项的字符向量,或 NULL(默认)。
有一个用于从拟合的聚类器预测类 ID 或成员资格的预测方法。
Cobweb 实现 Cobweb(Fisher,1987)和 Classit(Gennari 等,1989)聚类算法。
FarthestFirst 提供了 Hochbaum 和 Shmoys 的“最远优先遍历算法”,它作为一种快速的简单近似聚类器,模仿简单的 k 均值。
SimpleKMeans 使用 k 均值算法提供聚类。
XMeans 通过“改进结构部分”扩展了 k 均值,并自动确定聚类数量。
DBScan 提供了 Ester、Kriegel、Sander 和 Xu 的“基于密度的聚类算法”。请注意,噪声点被分配给 NA。
一个继承自 Weka_clusterers 类的列表,其组件包括
clusterer,对使用给定控制选项将 Weka buildClusterer 方法应用于训练实例获得的 Java 对象的引用(jobjRef 类)。
class_ids,一个整数向量,指示每个训练实例分配到的类(调用为已构建的聚类器和每个实例的 Weka clusterInstance 方法的结果)。
cl1 <- SimpleKMeans(iris[, -5], Weka_control(N = 3)) table(predict(cl1), iris$Species) cl2 <- XMeans(iris[, -5], c("-L", 3, "-H", 7, "-use-kdtree", "-K", "weka.core.neighboursearch.KDTree -P")) table(predict(cl2), iris$Species)