国家自然科学基金(60973062)
- 作品数:1 被引量:2H指数:1
- 相关作者:饶高琦荀恩东修驰更多>>
- 相关机构:北京语言大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于规则的名词短语预调序
- 短语预调序是提高机器翻译效果的有效手段。本文通过对英汉翻译中名词短语结构的分析,总结得到名词短语调序规则,通过将这些规则进行短语预调序,提高了最终的翻译效果。为了缓解专家规则覆盖范围太大的弊端,本文从大规模双语语料中自动...
- 牟小峰荀恩东
- 文献传递
- 语料库自然标注信息与中文分词应用研究(英文)被引量:2
- 2013年
- 以中文分词为应用目标,将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息,分别考察了它们的分布和对大数据集上语言计算的影响。结果表明,两者都直接或间接地表达了作者对语言的分割意志,因而对分词具有积极的影响。通过词语抽取测试,发现在缺乏丰富显性标注信息的文本中,来自语言固有规律的自然标注信息对字符串有着强大的分割性能。
- 饶高琦修驰荀恩东
- 关键词:中文分词大规模语料库