《计算机学报》文章摘要   全文下载
  文章题目大规模语音语料库及其在TTS中应用的几个问题
  作者章森 刘磊 刁麓弘
  作者单位(北京工业大学信息与计算科学实验室 北京 100022)
  发表年份2010
  发表月份4期(687—696)
  文章摘要摘要 首先介绍了大规模语音语料库以及基于大规模语音语料库的文语转换技术的研究现状,接着介绍了一个大规模连续汉语语音语料库的实例Slib的结构和内容;在此基础上,讨论了面向大规模语音语料库的索引技术,提出了语料库检索中的集合运算和最小包容问题,证明了最小包容问题是NP完全的,给出了求解该问题的贪婪算法以及算法的近似比;最后,讨论了基于集合运算的大规模语音语料库的检索技术在文语转换系统中的应用,特别是在基本语言单位实例的选取问题上实现了一种基于最小包容的优化方法,对提高文语转换系统的自然度有实用价值. 关键词 语音语料库;集合运算;文语转换;最小包容;信息检索 中图法分类号 TP391 DOI号 10.3724/SP.J.1016.2010.00687