刘智颖
- 作品数:14 被引量:23H指数:3
- 供职机构:北京师范大学中文信息处理研究所更多>>
- 发文基金:国家高技术研究发展计划教育部人文社会科学研究基金中央高校基本科研业务费专项资金更多>>
- 相关领域:语言文字自动化与计算机技术更多>>
- 基于概念层次网络的知识表示与本体建模被引量:7
- 2018年
- 知识表示是自然语言理解的重要基础。知识表示不统一、语义信息无法系统化利用是目前存在的亟待解决的问题。要解决这个问题,就要解决语义知识表示的问题。该文基于概念层次网络,描述了词语、句子和篇章层面的语义知识表示方法。基于文中描述的词汇层面的表示方法,构建了一个多语言本体知识库。该知识库的知识表示方法不仅可以为知识表示理论研究提供基础,还可以为自然语言处理相关领域的应用提供资源支持。
- 文亮李娟刘智颖晋耀红
- 关键词:概念层次网络本体建模
- 基于句法语义规则系统的比较句自动识别
- 针对汉语比较句的自动识别,提出一种基于句法语义规则的方法.将比较标记和比较结果做为识别比较句的关键因素,归纳汉语比较句的类别,书写比较句识别规则,同时设计4个模型进行分类识别.实验结果表明,规则系统可以有效地实现汉语比较...
- 白林楠胡韧奋刘智颖
- 关键词:汉语比较句自动识别
- 文献传递
- 概念类别及其在汉英机器翻译中的应用
- 2015年
- 词性作为划分词类的依据一直是信息处理中一项重要的知识属性。但是,词类更多地偏重于词语在句子中的语法功能,而忽略了词语意义对句子分析的作用,语言信息处理需要更有效、更细致的词语分类。为此,本文引入概念类别的信息,并且展示其在汉英机器翻译中的应用。通过具体描述给出概念类别及其与词性的对应关系,指出概念类别可划分为抽象概念和具体概念两大类型,抽象概念中又包括动态概念、静态概念、属性概念和逻辑概念,并对概念的所指及应用做出了描述。随后,本文对概念类别与词性的关系和差别做出了解释,并给出了概念类别与词性的对应关系。最后,本文描述了概念类别信息在汉英机器翻译中的具体应用,指出概念类别在汉英机器翻译的分析模块和转换模块(如小句转换、Eg识别、格式转换和辅块识别等)中均发挥着重要的作用。
- 朱筠刘智颖晋耀红
- 关键词:词性机器翻译
- 基于分布式表示的汉字部件表义能力测量与应用被引量:3
- 2021年
- 汉字的表义性是其区别于表音文字的一大特点。部件作为构字单位,同汉字的意义之间有着很大的联系。然而,汉字部件的表义能力究竟如何是学界尚待讨论的课题。针对这一问题,该文从汉字部件入手,提出了融合部件的字词分布式表示模型。该模型在向量内部评测任务上性能获得了一定提升,在汉字理据性测量任务上也与人工打分结果显著相关。基于该模型,进一步提出了部件表义能力的计算方法,对汉字部件的表义能力做了整体评估,并结合部件的构字能力建立了现代汉字部件的等级体系。测量结果显示,现代汉字部件具有一定表义能力,但整体而言表义能力偏低。最后,将测量结果应用于对外汉语教学中,确立了适用于部件教学法的部件范围,并提出了对应的汉字教学顺序方案。
- 梁诗尘唐雪梅胡韧奋吴金闪刘智颖
- 关键词:汉字部件
- 基于语料库的词义标注研究
- 本文基于汉语国际教育动态语料库,对现代汉语多义词标注问题进行了研究,发现词典义项的不当分立是多义词标注的难点,概括了词典义项分立中存在义项缺失、义项衍设和义项交叉三大类问题。研究发现搭配信息、义频信息、词性信息可以作为词...
- 白林楠杨丽姣刘智颖
- 关键词:多义词词义标注
- 文献传递
- 服务于汉英机器翻译的HNC词语知识库建设被引量:4
- 2015年
- HNC的知识库系统是服务于自然语言理解处理的知识表示体系和资源建设工程。本文在HNC词语知识库的基础上,研究建立服务于汉英机器翻译的语义知识库,以解决汉语和英语在词汇、语义、句法等方面的映射问题。该知识库是汉英机器翻译引擎的核心基础资源,在汉英机器翻译系统中发挥着重要作用。
- 刘智颖
- 关键词:机器翻译语义表示HNC理论
- 现代汉语句间省略考察
- 省略是基于简约的原则而略去了句中的某些成分,本文运用HNC句类及句类知识考察了句子的省略类型,省略成分与恢复成分对应关系,并给出了JKl省略恢复的判定规则。为计算机处理省略问题提供了一定的帮助。
- 刘智颖张玲
- 关键词:HNC理论语义块现代汉语
- 文献传递
- 《信息处理用现代汉语词类标记规范》修订研究被引量:1
- 2021年
- 《信息处理用现代汉语词类标记规范》是汉语语言信息处理和语料库建设中关于词类划分和标注的重要参考标准。本次修订的核心内容有两项:一是以完善规范和满足应用需要为导向,对基本词类、其他切分单位及其小类进行了修订,提升了规范的严谨性和适用性;二是提出了词类标记的组合应用原则,规定非词切分单位可以在类属标记之外,组合附加词类标记代码,以更全面准确地标注其语法功能。规范修订审慎处理了词类体系、词类划分、标记代码三者关系,为词与非词切分单位的语法功能标注提供了更科学合理的方案,提升了规范的科学性、实用性和可操作性。
- 杨丽姣肖航刘智颖
- 关键词:词类词类标注
- HNC语料标注的XML规范
- HNC语料库以HNC理论模式为指导、以句子为标注的基本单位对语料进行自上而下的语义标注。XML的易读性、易检性、层次性、扩展性等特点,使之成为实现语料标注和共享的理想工具。本文主要阐述用XML来进行语料标注时所存在的疑难...
- 刘智颖
- 关键词:HNC理论语料库XML技术资源共享数据查询
- 文献传递
- 汉英机器翻译中格式转换研究被引量:2
- 2014年
- 格式在HNC理论中是指广义作用句各主语块位置的不同排列组合方式。由于主语块的排列方式在汉英两种语言中表达的差异,汉语句子翻译到英语时常常发生格式转换。格式转换是HNC机器翻译理论的一个重要内容,是机器翻译理论实践的基础和前提。以HNC机器翻译理论为指导,以真实文本的专利文献汉英句对为分析对象,研究专利机器翻译中汉英两种语言之间广义作用句的格式转换规律,制定了排除规则、识别规则和转换规则,对部分规则进行了人工评测,结果表明准确率能达到85%左右。
- 刘智颖郭艳波晋耀红
- 关键词:机器翻译