| 《计算机学报》文章摘要 全文下载 | |
| 文章题目 | 复杂数据上的实体识别技术研究 |
| 作者 | 王宏志1) 樊文飞1),2) |
| 作者单位 | 1)(哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001) 2)(爱丁堡大学信息学院 英国爱丁堡 EH8 9AB) |
| 发表年份 | 2011 |
| 发表月份 | 10期(1843—1852) |
| 文章摘要 | 摘要 复杂数据当前有着广泛的应用.有效地使用复杂数据需要对其质量进行管理.实体识别是数据质量管理的基本操作,用于在数据集合中发现同一实体的不同描述,其在数据质量管理中可以用于错误检测、不一致数据发现等.由于包含复杂的结构信息,复杂数据上的实体识别与传统文本和关系数据上的实体识别不同,带来了新的技术上的挑战.该文介绍了复杂数据上实体识别的概念和应用,分别讨论了XML数据、图数据和复杂网络上实体识别技术的原理,最后展望了未来的研究方向. 关键词 数据质量;复杂数据;实体识别;XML图;复杂网络 中图法分类号 TP311 DOI号: 10.3724/SP.J.1016.2011.01843 |