《计算机学报》文章摘要   全文下载
  文章题目XML文档的相似测度和结构索引研究
  作者郑仕辉 周傲英 张龙
  作者单位(复旦大学计算机科学与工程系 上海 200433)
  发表年份2003
  发表月份9期(页码: 1116-1122)
  文章摘要摘要 提出了一个可用于定量度量XML文档间差异的方法(称为XED距离).利用结点间的模拟关系,一个XML文档可以表示为一棵精简的、带权重的结构索引树.两个XML文档间的相似度可以通过计算它们的索引树间的编辑距离来测定.利用索引树可以大大提高判定两个XML文档结构相似度的效率.XED距离测度可用于XML文档的结构搜索、XML文档聚类、XML文档结构抽取、XML文档的变换检测以及XML视图的增量计算和维护等. 关键词 编辑距离;XED距离;结构索引树 中图法分类号 TP311