《计算机学报》文章摘要   全文下载
  文章题目基于子话题分治匹配的新事件检测
  作者洪宇 张宇 范基礼 刘挺 李生
  作者单位(哈尔滨工业大学计算机科学与技术学院信息检索研究室 哈尔滨 150001)
  发表年份2008
  发表月份4期(687—695)
  文章摘要摘要 新事件检测是话题检测与跟踪领域的一项重要研究,其任务是实时监控新闻报道流并从中识别新话题.现有方法将话题和报道描述为单一结构的特征向量进行匹配,造成子话题间互为噪声并形成错误语义,从而误导新话题的识别.针对这一缺陷,文中提出基于子话题分治匹配的新事件检测方法,将话题和报道划分为不同子话题,根据相关子话题的比例关系和分布关系建立新话题识别模型.实验在TDT4和TDT5中获得显著改进,最小检测错误代价为0.4061,相应漏检率为0.1859. 关键词 新事件检测;话题检测与跟踪;子话题