《计算机学报》文章摘要   全文下载
  文章题目高效的随机访问分块倒排文件自索引技术
  作者刘小珠1), 2) 彭智勇3) 陈旭3)
  作者单位1)(武汉大学软件工程国家重点实验室 武汉 430072) 2)(武汉理工大学自动化学院 武汉 430070) 3)(武汉大学计算机学院 武汉 430072)
  发表年份2010
  发表月份6期(977—987)
  文章摘要摘要 针对倒排索引空间开销大、查询时间效率低以及难以同时支持连接布尔查询和排序查询的问题,提出了一种同时提高空间效率与查询时间效率的高效随机访问分块倒排文件自索引RABIF.为了在降低空间消耗的同时支持连接布尔查询与排序查询,RABIF将倒排列表进行合理地分块,然后对每个子块的不同部分采用相应的压缩方式,在不需要插入任何附加辅助信息的前提下实现压缩索引的快速定位与随机访问.理论分析及实验结果表明,与忽略倒排文件自索引SIF相比,提出的RABIF空间开销平均减少5.3%,布尔查询时间平均减少17.8%;对于0.2%与1%排序查询,查询时间分别平均减少34.4%与27.5%. 关键词 倒排文件;自索引;时间效率;空间效率;随机访问 中图法分类号 TP391 DOI号: 10.3724/SP.J.1016.2010.00977