荀恩东
- 作品数:83 被引量:504H指数:9
- 供职机构:北京语言大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学艺术更多>>
- 英汉机器翻译系统BT863-Ⅱ的消歧策略研究
- 翻译中的消歧任务贯穿于整个翻译过程。该文将英汉机器翻译中的歧义问题归纳为词法歧义、兼类歧义、句法歧义和译文歧义等4种,研究了多层次渐进解峻方式和规则与统计方法相结合的混合消歧策略。该文全面介绍了上述策略在一个实用化英汉机...
- 赵铁军荀恩东樊艳梅
- 关键词:消歧机器翻译
- 基于规则的名词短语预调序
- 短语预调序是提高机器翻译效果的有效手段。本文通过对英汉翻译中名词短语结构的分析,总结得到名词短语调序规则,通过将这些规则进行短语预调序,提高了最终的翻译效果。为了缓解专家规则覆盖范围太大的弊端,本文从大规模双语语料中自动...
- 牟小峰荀恩东
- 文献传递
- 篇章链接标记研究
- 卢露矫红岩荀恩东
- 中文职衔履历信息的知识协同挖掘和属性联合抽取
- 研究从非结构化文本中抽取指定人物职衔履历信息的方法.针对履历信息中知识密集的特点,定义职衔履历知识结构,提出从字符串模式和依存上下文两个角度刻画履历信息.采用弱监督知识与人工标注知识协同挖掘的方法,从大规模在线文本中挖掘...
- 于东荀恩东
- 一种以事件为核心的语义表示方法
- 本发明提供一种以事件为核心的语义表示方法,是一种句子的语义表示方法,从形式来看,语义图主要由节点和边组成,节点表示句子中的词语或概念,边表示它们之间的关系;从内容来看,语义图主要由两部分构成:事件结构与实体结构。所述事件...
- 荀恩东王贵荣
- 一种融入偏旁语义的中文文本分类方法
- 本发明提供了一种融入偏旁语义的中文文本分类方法,首先使用BERT模型对中文文本和偏旁进行向量化表示,然后分别使用不同的深度学习模型对中文文本和偏旁进行特征提取,最后对中文文本和偏旁的特征向量进行融合,利用softmax分...
- 刘忠宝荀恩东赵文娟
- 文献传递
- 匹配树和决策树方法识别英语句子中的BaseNP被引量:6
- 2000年
- 提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语 (Base NP) .在含有词性标注和 Base NP边界标注的训练语料中 ,抽取所有不同类型 Base NP短语对应的词性序列 (Base NP规则 ) ,通过规则排序和语言学知识 ,对其中正确率低且明显不符合语法的规则进行剔除 .在识别时 ,采取规则匹配树的方法进行最大长度匹配 ,通过归纳机器学习 C4.5算法引入上下文信息 ,由 C4.5算法学习出有效 (或无效 )应用 Base NP规则的条件 ,参照上下文条件 ,约束应用 Base NP规则 .实验结果表明 ,提出的方法具有很高的正确率和召回率 .
- 荀恩东李生赵铁军
- 关键词:决策树英语句子自然语言处理
- 基于互连网的术语定义获取系统被引量:21
- 2004年
- 文中介绍了一个实验性的基于互联网的术语定义获取系统 ,可以方便、迅速的从互连网上查找术语的定义以及与定义有关的内容 ,给用户迅速获得新生术语以及新技术词汇的定义方面的知识提供方便。系统采用一组术语定义的语言学模式 ,以多线程方式高效下载网页 ,并从中匹配符合术语定义模式的文本段落 ,再经一定后续处理 ,形成返回给用户的结果。系统中使用的语言学模式是在一定量的科技期刊语料库中获取的。试验结果表明系统的运行效率高 。
- 许勇荀恩东贾爱平宋柔
- 关键词:人工智能自然语言处理信息抽取
- 统计与学习并举的渐进式英语句法分析
- 句法分析是自然语言处理的一个重要研究内容之一,给定输入句子,句法分析的任务就是生成一棵带有句法功能标记的短语结构树,它能指明短语的构成成分及其之间的相互关系.英语句法分析对于英汉机器翻译有着非常重要的意义,输入英语句子的...
- 荀恩东
- 关键词:句法分析词性标注决策树
- 文献传递
- 基于知网义原词向量表示的无监督词义消歧方法被引量:14
- 2015年
- 词义消歧一直是自然语言处理领域中的重要问题,该文将知网(HowNet)中表示词语语义的义原信息融入到语言模型的训练中。通过义原向量对词语进行向量化表示,实现了词语语义特征的自动学习,提高了特征学习效率。针对多义词的语义消歧,该文将多义词的上下文作为特征,形成特征向量,通过计算多义词词向量与特征向量之间相似度进行词语消歧。作为一种无监督的方法,该方法大大降低了词义消歧的计算和时间成本。在SENSEVAL-3的测试数据中准确率达到了37.7%,略高于相同测试集下其他无监督词义消歧方法的准确率。
- 唐共波于东荀恩东
- 关键词:《知网》词义消歧