张玮
- 作品数:6 被引量:11H指数:2
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于非连续短语的统计翻译模型
- 本文给出了基于非连续短语的统计翻译方法,翻译的基本单元从连续短语扩展到带有间隔的非连续短语,这种方法可以更好地解决句子中词语翻译时的上下文依赖问题.在形式上,非连续短语方法和层次型短语方法相似,不同之处在于前者只允许包含...
- 张大鲲张玮董静
- 关键词:统计机器翻译
- 文献传递
- 基于非连续短语的统计翻译模型
- 本文给出了基于非连续短语的统计翻译方法,翻译的基本单元从连续短语扩展到带有间隔的非连续短语,这种方法可以更好地解决句子中词语翻译时的上下文依赖问题。在形式上,非连续短语方法和层次型短语方法相似,不同之处在于前者只允许包含...
- 张大鲲张玮董静
- 关键词:统计机器翻译
- 词汇搭配和用户模型在拼音输入法中的应用被引量:6
- 2007年
- 中文输入法是中文信息处理的难题之一。随着互联网上中文用户的不断增加,中文输入法的重要性也变得日益突出。本文在对句子中长距离词汇依赖现象观察的基础上,抽取出语料库中的词汇搭配来获取长距离特征,并以此构建基于词汇搭配关系的拼音输入法系统;同时将词汇搭配的思想应用到拼音输入法的用户模型中,从而使我们的输入法系统能够辅助用户更加有效的输入。实验表明基于词汇搭配关系的改进方法对提高输入法的准确率有积极的作用。
- 张玮孙乐冯元勇李文波黄瑞红
- 关键词:中文信息处理中文输入法中文信息处理统计语言模型词汇搭配用户模型
- 一种结合分类模型的中文输入法
- 中文输入法是中文信息处理的基础软件。本文针对现有输入法很少考虑利用候选词语本身特性来进行排序的情况,给出了将输入法词库进行类别标注以及在输入法系统中集成分类引擎的方法,提高和当前输入内容相关的候选词权重。首先给出了语言模...
- 张玮孙乐冯元勇吕元华
- 关键词:中文输入法中文信息处理分类引擎语言模型
- 文献传递
- 基于非连续短语的统计翻译模型研究被引量:5
- 2007年
- 目前统计机器翻译的主流方法仍然是基于短语的翻译模型。然而,该模型并没有考虑对非连续短语的处理。本文提出了一种基于非连续短语的统计翻译模型,利用该模型可以使翻译的基本单元从连续短语扩展到带有间隔的非连续短语,以更好地解决词语翻译时的上下文依赖问题。同时,由于该方法抽取的短语数量较少,也使得解码的效率得到了提高。实验表明,在效率提高的情况下,非连续短语模型可以取得与层次型短语模型相当的翻译结果。
- 张大鲲张玮冯元勇孙乐
- 关键词:人工智能机器翻译统计机器翻译
- 基于词汇关系的个性化拼音输入法研究与实现
- 汉字输入技术是中文信息处理领域中特有的一项基础性关键技术。虽然目前有一些不依赖键盘的汉字输入产品和不少基于汉字字形的输入法,但是毋庸置疑拼音输入法是互联网用户最常用的汉字输入工具。
在互联网高速发展的今天,尤其在W...
- 张玮
- 关键词:拼音输入