| 《计算机学报》文章摘要 全文下载 | |
| 文章题目 | 数据流上近似非可导项集的挖掘算法 |
| 作者 | 黄崇争1),2) 李海峰3) 陈红1) |
| 作者单位 | 1)(中国人民大学信息学院 北京 100872) 2)(广西建设职业技术学院 计算机与信息技术系 南宁 530003) 3)(中央财经大学信息学院 北京 100081) |
| 发表年份 | 2010 |
| 发表月份 | 8期(1427—1436) |
| 文章摘要 | 摘要 频繁项集是通过对大规模数据进行挖掘获取的代表数据模式的知识结构.非可导频繁项集作为频繁项集的有效压缩方式,能够高效深入地挖掘海量数据、稠密数据与数据流当中的规律.针对项集在计算界限值时代价昂贵的缺点,提出了近似可导项集的概念,并基于纵向数据格式实现了挖掘算法MANDI,能够提高支持度计算和项集间操作的速度.另外,为了满足数据流实时、快速的特点,讨论并证明了近似可导项集的增量性质,提出了可动态更新的算法UANDI.通过实验验证了两种算法的可行性和有效性. 关键词 近似非可导频繁项集; 纵向数据格式;数据流; 数据流挖掘 中图法分类号 TP18 DOI号:10.3724/SP.J.1016.2010.01427 |