《计算机学报》文章摘要   全文下载
  文章题目基于双语对齐口语语料的翻译词典的自动生成
  作者陈博兴 杜利民
  作者单位(中国科学院声学研究所语音交互技术研究中心 北京 100080)
  发表年份2003
  发表月份3期 (页码:275—280)
  文章摘要摘要 提出了一个基于英汉双语口语对齐语料库的翻译词典的自动生成算法.首先利用释义词典过滤双语文本,得到“过滤词典”,继而通过统计共现概率,计算出所有词对的相互关联值,并且生成“汉英(英汉)相互关联值表”,对于每个源语词汇选取相互关联值最大的若干项目标语作为候选词对,分别赋予信任值1,然后统计每个候选词对的信任值作为翻译词典的分级标准,得到4个不同级别的词典,其中“过滤词典+4级词典”在召回率为935%的情况下,正确率达到93389%. 关键词 双语对齐;翻译词典;关联值 中图法分类号 TP18