《计算机学报》文章摘要 全文下载 | |
文章题目 | XML文档的相似测度和结构索引研究 |
作者 | 郑仕辉 周傲英 张龙 |
作者单位 | (复旦大学计算机科学与工程系 上海 200433) |
发表年份 | 2003 |
发表月份 | 9期(页码: 1116-1122) |
文章摘要 | 摘要 提出了一个可用于定量度量XML文档间差异的方法(称为XED距离).利用结点间的模拟关系,一个XML文档可以表示为一棵精简的、带权重的结构索引树.两个XML文档间的相似度可以通过计算它们的索引树间的编辑距离来测定.利用索引树可以大大提高判定两个XML文档结构相似度的效率.XED距离测度可用于XML文档的结构搜索、XML文档聚类、XML文档结构抽取、XML文档的变换检测以及XML视图的增量计算和维护等. 关键词 编辑距离;XED距离;结构索引树 中图法分类号 TP311 |