《计算机学报》文章摘要 全文下载 | |
文章题目 | 关键词自动标引的最大熵模型应用研究 |
作者 | 李素建1) 王厚峰1) 俞士汶1) 辛乘胜2) |
作者单位 | 1)(北京大学计算语言学研究所 北京 100871) 2)(人民日报社新闻信息中心 北京 100733) |
发表年份 | 2004 |
发表月份 | 9期(1192—1197) |
文章摘要 | 摘要 关键词是文档管理、文本聚类/分类、信息检索等领域可利用的重要资源,因此该文提出了利用最大熵模型进行自动标引的技术.最大熵模型为一个成熟的数学模型,已经应用到计算语言学的各个领域.然而它的应用非常灵活,针对标引任务和现有资源的实际情况,作者首先建立了最大熵模型的特征集合,然后提出了三种试验方法,并给出了相应的试验结果,最后针对最大熵模型在关键词自动标引任务中的应用做了有益的分析和探讨.该研究对于关键词标引研究以及最大熵在其他领域中的应用将有所启示. 关键词 关键词标引;关键词抽取;最大熵模型;信息抽取 中图法分类号 TP391 |