张振中
- 作品数:3 被引量:1H指数:1
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于翻译模型的查询会话检测方法研究被引量:1
- 2015年
- 查询会话检测的目的是确定用户为了满足某个特定需求而连续提交的相关查询。查询会话检测对于查询日志分析以及用户行为分析来说是非常有用的。传统的查询会话检测方法大都基于查询词的比较,无法解决词语不匹配问题(vocabulary-mismatch problem)——有些主题相关的查询之间并没有相同的词语。为了解决词语不匹配问题,我们在该文提出了一种基于翻译模型的查询会话检测方法,该方法将词与词之间的关系刻画为词与词之间的翻译概率,这样即使词与词之间没有相同的词语,我们也可以捕捉到它们之间的语义关系。同时,我们也提出了两种从查询日志中估计词翻译概率的方法,第一种方法基于查询的时间间隔,第二种方法基于查询的点击URLs。实验结果证明了该方法的有效性。
- 张振中孙乐韩先培
- 关键词:查询日志
- ISCAS机器翻译和系统融合评测系统介绍
- 本文给出了参加第五届全国机器翻译研讨会(CWMT2009)评测的系统介绍,包括基于短语的统计机器翻译模型以及两个系统融合模型。翻译系统首先对训练语料进行预处理,构造了一个基本系统,然后利用大小写敏感的4元语言模型恢复英文...
- 张大鲲张振中孙乐
- 关键词:机器翻译语言模型
- 文献传递
- 一种改进的统计机器翻译系统融合方法
- 本文提出一种基于一致性网络和最小贝叶斯风险联合解码的统计机器翻译系统融合方法。首先利用N-best译文集合建立一致性网络,从一致性网络产生的新译文中选出得分最高的前N个译文,然后从这N个候选译文中选出具有最小贝叶斯风险的...
- 张振中孙乐张大鲲
- 关键词:机器翻译
- 文献传递