张冬梅
- 作品数:3 被引量:10H指数:2
- 供职机构:北京师范大学中文信息处理研究所更多>>
- 发文基金:国家高技术研究发展计划国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于模板的汉英专利机器翻译研究被引量:6
- 2013年
- 为了改善专利文献的机器翻译效果,提出了一种基于模板的机器翻译方法。通过分析汉英双语对齐的专利文献语料,人工书写了600余条模板,模板的设计思想源于弱化的正则文法;设计和实现了一个模板翻译模块,并将其与已有的一个基于规则的机器翻译系统相融合。实验结果表明,40%以上的测试文本的翻译质量得到了提高,因此,这种基于模板的方法对于改善专利文献的机器翻译效果是有效的。
- 张冬梅刘小蝶晋耀红
- 关键词:机器翻译正则文法
- 一种基于C#正则表达式的汉语文本信息检索方法被引量:1
- 2009年
- C#中的正则表达式可以按照用户指定的模式从非结构化文本中提取信息,简单易用,功能强大。简要介绍C#正则表达式主要的语法格式和功能,结合汉语文本检索的实例,演示其使用方法。上机实验结果表明,C#正则表达式在处理汉语文本时的准确率和效率都是较高的,F值为95.53%。
- 宋培彦张冬梅
- 关键词:正则表达式信息检索中文信息处理
- 面向专利机器翻译的要素句蜕识别和转换研究被引量:3
- 2014年
- 为了改善专利机器翻译中要素句蜕的翻译效果,提出了一种基于规则的要素句蜕识别和转换方法。通过分析汉语要素句蜕的格式,提取了汉语要素句蜕的描述特征,在此基础上制定了要素句蜕的识别规则。通过对比汉英要素句蜕,总结了两者的差异,在此基础上制定了汉英要素句蜕的转换规则。最后,将识别规则和转换规则应用到一个已有的机器翻译系统中。测试结果表明,这种方法可以有效地实现对要素句蜕的识别和转换,进而提高了专利文本中要素句蜕的机器翻译效果。
- 张冬梅晋耀红
- 关键词:机器翻译