| 《计算机学报》文章摘要 全文下载 | |
| 文章题目 | 基于词汇链的关键短语抽取方法的研究 |
| 作者 | 刘铭 王晓龙 刘远超 |
| 作者单位 | (哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001) |
| 发表年份 | 2010 |
| 发表月份 | 7期(1246—1255) |
| 文章摘要 | 摘要 文中提出一种基于词汇链的关键短语抽取算法,算法首先通过构造多条词汇链来表达文章的多条叙事线索,并从多条词汇链中抽取富含主题信息的强链代表文章着重叙述的信息,然后从强链中选取能够从不同侧面充分表达强链所述信息的短语作为文章的关键短语.实验表明该算法抽取的关键短语能够更全面地覆盖文章的主题信息.算法消除了多个关键短语表达同一主题信息的冗余性,同时可以根据文章主题的分布动态确定输出的关键短语的数量,其效果明显优于采用统计信息进行关键词抽取的方法. 关键词 词汇链;知网;中心词聚类;关键短语;词义获取 中图法分类号 TP391 DOI号: 10.3724/SP.J.1016.2010.01246 |