《计算机学报》文章摘要 全文下载 | |
文章题目 | 利用自动机高效处理XML路径表达式查询 |
作者 | 王国仁 于勇前 孙冰 |
作者单位 | (东北大学信息科学与工程学院 沈阳 110004) |
发表年份 | 2007 |
发表月份 | 9期(1520—1532) |
文章摘要 | 摘要 在XML查询处理中,应用于绝大多数XML查询语言中的路径表达式在定位和查询XML数据和数据的结构关系方面具有极强的表达能力,并且由于XML数据的半结构化性,使得XML路径表达式查询的查询处理技术的研究与传统的数据库查询处理技术相比有着全新的特点和挑战.一些目前已有的查询处理技术可以用来处理路径表达式,但是查询处理中产生的大量中间结果导致了这些方法应用在大规模XML文档和复杂的路径表达式查询中时查询效率急剧下降.文中利用自动机技术设计了一个处理XML路径表达式查询的高效方法——SAM.SAM的基本思想是将路径表达式查询转化成一个与之完全等价的自动机,然后将其与从XML文档中抽象出来的模式路径相匹配.文中同时也给出了基于SAM方法的针对路径表达式中“//”操作符计算的有效解决方案.实验证明:SAM是一种非常有效的查询方法,在计算大数据量复杂路径表达式查询时具有非常高的效率,是一种实用的XML路径表达式查询方法. 关键词 XML路径表达式;自动机;查询处理 中图法分类号 TP311 |