朱筠
- 作品数:7 被引量:15H指数:3
- 供职机构:北京师范大学中文信息处理研究所更多>>
- 发文基金:国家高技术研究发展计划中央高校基本科研业务费专项资金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 概念类别及其在汉英机器翻译中的应用
- 2015年
- 词性作为划分词类的依据一直是信息处理中一项重要的知识属性。但是,词类更多地偏重于词语在句子中的语法功能,而忽略了词语意义对句子分析的作用,语言信息处理需要更有效、更细致的词语分类。为此,本文引入概念类别的信息,并且展示其在汉英机器翻译中的应用。通过具体描述给出概念类别及其与词性的对应关系,指出概念类别可划分为抽象概念和具体概念两大类型,抽象概念中又包括动态概念、静态概念、属性概念和逻辑概念,并对概念的所指及应用做出了描述。随后,本文对概念类别与词性的关系和差别做出了解释,并给出了概念类别与词性的对应关系。最后,本文描述了概念类别信息在汉英机器翻译中的具体应用,指出概念类别在汉英机器翻译的分析模块和转换模块(如小句转换、Eg识别、格式转换和辅块识别等)中均发挥着重要的作用。
- 朱筠刘智颖晋耀红
- 关键词:词性机器翻译
- 面向汉英专利机器翻译的复杂谓语形态转换研究被引量:3
- 2015年
- 在将汉语句子翻译成英语时,需要对谓语动词进行形态转换。由于汉语缺乏显性的形态标记,转换时需要借助句中其他辅助信息确定英语语句中谓语的形态。本文从汉英专利机器翻译的实际需求出发,对复杂谓语的构成方式进行分类梳理,对复杂谓语的形态转换方式进行对比研究,在此基础上整理形式化转换规则,最终将规则应用于实际的机器翻译系统。
- 朱筠晋耀红
- 关键词:复杂谓语汉英机器翻译
- 面向专利领域的汉英机器翻译融合系统被引量:7
- 2017年
- 面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。
- 李洪政赵凯胡韧奋蒋宏飞朱筠晋耀红
- 关键词:机器翻译
- 汉英专利机器翻译中动-介兼类词自动识别被引量:1
- 2015年
- 兼类词在汉语专利语料中分布普遍。面向汉英专利机器翻译提出了一种基于规则的动-介兼类词识别方法。根据边界感知原则和兼类词的句法语义属性以及周围的语境信息,设计了一系列兼类排歧规则,同时分别提出了兼类词识别为动词或介词的策略,并以形式化的规则加以描述。相关实验测试表明提出的方法可以有效地识别动-介兼类词语,对改善翻译系统的翻译结果也有帮助。
- 李洪政朱筠晋耀红
- 关键词:动词介词兼类词机器翻译
- 中文专利中有标记并列结构的自动识别研究被引量:5
- 2018年
- 中文专利中名词性有标记并列结构分布广泛、结构复杂,现有的识别技术仅能运用有限的特征识别某些简单类型的并列结构,总体识别效果不佳。为此,提出一种基于边界感知原则的识别方法。在概念层次网络(HNC)理论的基础上,从数量、层级、语义类型、语义特征、干扰特征、结构特征、外部环境和位置特征8个维度对并列结构进行标注,考察并总结语义特征、结构特征和外部词特征,制定217条形式化规则,并将其融合到已有的HNC翻译系统中。测试结果表明,与Google在线翻译系统相比,该方法对有标记并列结构的识别正确率较高。
- 刘小蝶朱筠晋耀红
- 关键词:机器翻译
- 面向汉英专利机器翻译的“V_1+V_2”结构识别方法研究
- 2013年
- 两个动词经常连续出现在一个句子中是汉语专利文本的重要特点之一,如何在几个动词中正确识别出核心谓语动词是汉英专利机器翻译面临的一个关键问题。基于"概念层次网络理论"(HNC),本文首先分析了几种常见的"V1+V2"结构,并提出了识别各种"V1+V2"结构以及核心动词的处理策略。系统会根据匹配的规则分析不同动词之间的关系,赋予每个动词不同的权重并打上相应标记,然后根据标记判断核心动词与其他动词的关系。将识别方法应用到专利机器翻译系统后进行的实验结果表明,处理方法可以较准确地识别出复杂句子中的谓语和"V1+V2"结构,这对于有效改善翻译的效果,促进机器翻译及自然语言处理的发展都有积极的影响。
- 李洪政朱筠晋耀红
- 关键词:机器翻译
- 基于概念层次网络(HNC)理论的专利汉英机器翻译系统
- 朱筠晋耀红