《计算机学报》文章摘要 全文下载 | |
文章题目 | 一种基于增量学习型矢量量化的有效文本分类算法 |
作者 | 王修君 沈鸿 |
作者单位 | (中国科学技术大学计算机科学与技术系 合肥 230039) |
发表年份 | 2007 |
发表月份 | 8期(1277—1285) |
文章摘要 | 摘要 KNN作为一种简单的分类方法在文本分类中有广泛的应用,但存在着计算量大和训练文档分布不均所造成的分类准确率下降等问题.针对这些问题,基于最小化学习误差的增量思想,该文将学习型矢量量化(LVQ)和生长型神经气(GNG)结合起来提出一种新的增量学习型矢量量化方法,并将其应用到文本分类中.文中提出的算法对所有的训练样本有选择性地进行一次训练就可以生成有效的代表样本集,具有较强的学习能力.实验结果表明:这种方法不仅可以降低KNN方法的测试时间,而且可以保持甚至提高分类的准确性. 关键词 学习型矢量量化(LVQ);生长型神经气(GNG);学习误差;类间距离;学习概率 中图法分类号 TP181 |