晋耀红
- 作品数:45 被引量:144H指数:6
- 供职机构:北京师范大学中文信息处理研究所更多>>
- 发文基金:国家高技术研究发展计划中央高校基本科研业务费专项资金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 汉语介词短语自动识别研究综述被引量:1
- 2017年
- 作为一种重要的短语类型,介词短语在汉语中分布广泛,正确识别汉语介词短语对自然语言处理领域的很多任务和应用都有重要的作用和意义。该文对近些年与识别汉语介词短语有关的研究做了梳理,从研究对象、实验评价标准和具体研究方法等几个方面比较详细地介绍了相关工作,最后归纳了汉语介词短语识别研究中表现出来的一些特点,并对未来研究的发展提出了几点建议。
- 李洪政晋耀红
- 关键词:介词短语
- 一种中文句子中谓语语块提取方法及系统
- 本发明提供了一种中文句子中谓语语块提取方法及系统,通过对中文句子进行分词处理,得到所述中文句子中的所有分词单位构成的分词单位序列集合;加载所述分词单位序列集合对应的概念,获得所述中文句子中所有分词单位的全部概念;对动态概...
- 朱筠晋耀红刘小蝶
- 汉语理解处理中多动词难点的研究与实现
- 在概念层次网络理论(Hierarchical Network of Concepts简称HNC)体系下,对句子语义分析时碰到的多动词难点,进行研究,并在句类分析系统中实现它.动词构成特征语义块,特征语义块是句子语义分析的...
- 晋耀红
- 关键词:汉语处理
- 汉语理解系统的核心技术-句类分析技术
- 黄曾阳张全晋耀红苗传江张倪杜燕玲林杏光张普王厚峰刘志文庄咏谬萧友菱雷良颖薛侃张艳红郝惠宁陶明阳汪保安初玉凤孙伟峰武连文尚京陈磊热汗姑丽
- 句类分析技术包括知识库和软件分析系统。目前该技术对一般应用文的处理能力为:语义块感知处理的正确率≥90%;句类分析正确率,基本句类≥95%或混合句类≥90%。并已经应用到语音识别系统和文语转换系统中,取得了较理想的结果。...
- 关键词:
- 关键词:自然语言理解句类分析
- 一种利用语义分析的垂直搜索引擎系统与方法
- 本发明公开了一种利用语义分析的垂直搜索引擎系统与方法。该系统包括文本语义分析、索引系统、检索系统三个模块。文本语义分析模块以句为单位,提取文本中每个句子所表示的语境属性,并对语境属性进行切分标注;语境属性综合了词语的出现...
- 晋耀红
- 概念类别及其在汉英机器翻译中的应用
- 2015年
- 词性作为划分词类的依据一直是信息处理中一项重要的知识属性。但是,词类更多地偏重于词语在句子中的语法功能,而忽略了词语意义对句子分析的作用,语言信息处理需要更有效、更细致的词语分类。为此,本文引入概念类别的信息,并且展示其在汉英机器翻译中的应用。通过具体描述给出概念类别及其与词性的对应关系,指出概念类别可划分为抽象概念和具体概念两大类型,抽象概念中又包括动态概念、静态概念、属性概念和逻辑概念,并对概念的所指及应用做出了描述。随后,本文对概念类别与词性的关系和差别做出了解释,并给出了概念类别与词性的对应关系。最后,本文描述了概念类别信息在汉英机器翻译中的具体应用,指出概念类别在汉英机器翻译的分析模块和转换模块(如小句转换、Eg识别、格式转换和辅块识别等)中均发挥着重要的作用。
- 朱筠刘智颖晋耀红
- 关键词:词性机器翻译
- 基于条件随机场方法的汉语专利文本介词短语识别被引量:1
- 2015年
- 介词短语作为一种重要的短语类型在汉语中分布广泛,正确自动识别介词短语在自然语言处理的应用领域具有重要意义和积极影响。本文尝试利用目前比较流行的条件随机场模型,主要面向汉语专利文本,对其中的介词短语进行识别研究。首先在分词和词性标注的基础上对语料进行序列特征标注,然后利用条件随机场工具包训练了识别介词短语的模型,最后设计相关实验来验证方法的效果,实验准确率达到90%以上。
- 李洪政晋耀红
- 关键词:介词短语条件随机场
- 一种用于语言理解的层次语义树构建方法及系统
- 一种用于语言理解的层次语义树构建方法及系统,该方法主要包括以下步骤:对语句进行分词并加载语义知识库;根据LV规则识别语句的所有节点,根据语义知识和词语位置及搭配识别节点的层次;把句末标点生成特殊的节点,作为语义树的根节点...
- 晋耀红朱筠刘小蝶
- 文献传递
- 一种用于句子分析中动词歧义结构消解的语义分析方法
- 本发明公开了用于句子分析中动词歧义结构消解的语义分析方法,包括:语义模型的构建和语义分析方法,所述的语义模型用于表达动词的歧义结构,所述的语义分析方法根据语义模型实现歧义结构的判断、消解和计算。本发明的优点在于:建立一种...
- 晋耀红苗传江邬郑
- 文献传递
- 基于语境框架的文本相似度计算被引量:42
- 2004年
- 介绍了一种新的文本形式化的语义模型———语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)三个侧面。在语境框架的基础上,设计实现了文本相似度计算算法。算法从概念层面入手,充分考虑了文本的领域和对象的语义角色对相似度的影响,重点针对文本中的歧义、多义、概念组合现象,以及语言中的褒贬倾向,实现了文本间语义相似程度的量化。算法已经应用到文本过滤系统中,用以比较用户过滤要求和待过滤文本之间的相似度。实际应用中取得了比较满意的效果。
- 晋耀红
- 关键词:文本相似度情景褒贬