跳转至内容

R 中的数据挖掘算法/包/arules/adult

来自 Wikibooks,开放世界中的开放书籍

技术/算法

[编辑 | 编辑源代码]

可视化

[编辑 | 编辑源代码]

案例研究

[编辑 | 编辑源代码]

数据集

[编辑 | 编辑源代码]

我们观察到 CSPADE 从用户行为中找到了许多平凡的序列。例如,它找到了许多单元序列,例如 <{设计}>、<{ajax}>、<{css}> 等。这些单元序列使用频率很高,但在标签推荐这种特定应用中可能没有用处。

此外,还发现了其他平凡的序列,例如 <{设计}.{设计}> 和 <{webdesign},{设计}>。这些序列表明相同的用户倾向于随后对同一主题的页面进行书签。但是,也发现了一些有趣的模式。我们可以引用 <{library},{books}>、<{javascript},{ajax}> 和 <{video},{youtube}>。

我们还可以观察到许多频繁模式与设计艺术web_development相关。这些标签也是整个 Delicious 系统中最受欢迎的标签,可以从这里看到。

参考文献

[编辑 | 编辑源代码]
  1. ^ Li, K.-C., Chang, D.-J., Rouchka, E. C., Chen, Y. Y., 2007. "生物序列挖掘使用似是而非的神经网络及其在内含子/外显子边界预测中的应用". 载于:CIBCB。IEEE,第 165–169 页。
  2. ^ Peng, W.-C., Liao, Z.-X., 2009. "跨多个序列数据库挖掘顺序模式". 数据知识工程。68 (10),1014–1033。
  3. ^ 电信纸,2009 年 1 月。"谷歌查询量"。
  4. ^ Zaki, M. J., 2001. "Spade:一种用于挖掘频繁序列的有效算法"。载于:机器学习。第 42 卷。第 31–60 页。
华夏公益教科书