R 中的数据挖掘算法/包/arules/adult

简介

技术/算法

算法

实现

可视化

案例研究

场景

数据集

执行

输出 =

分析

我们观察到 CSPADE 从用户行为中找到了许多平凡的序列。例如，它找到了许多单元序列，例如 <{设计}>、<{ajax}>、<{css}> 等。这些单元序列使用频率很高，但在标签推荐这种特定应用中可能没有用处。

此外，还发现了其他平凡的序列，例如 <{设计}.{设计}> 和 <{webdesign},{设计}>。这些序列表明相同的用户倾向于随后对同一主题的页面进行书签。但是，也发现了一些有趣的模式。我们可以引用 <{library},{books}>、<{javascript},{ajax}> 和 <{video},{youtube}>。

我们还可以观察到许多频繁模式与设计、艺术和web_development相关。这些标签也是整个 Delicious 系统中最受欢迎的标签，可以从这里看到。

参考文献

^ Li, K.-C., Chang, D.-J., Rouchka, E. C., Chen, Y. Y., 2007. "生物序列挖掘使用似是而非的神经网络及其在内含子/外显子边界预测中的应用". 载于：CIBCB。IEEE，第 165–169 页。
^ Peng, W.-C., Liao, Z.-X., 2009. "跨多个序列数据库挖掘顺序模式". 数据知识工程。68 (10)，1014–1033。
^ 电信纸，2009 年 1 月。"谷歌查询量"。
^ Zaki, M. J., 2001. "Spade：一种用于挖掘频繁序列的有效算法"。载于：机器学习。第 42 卷。第 31–60 页。