董静
- 作品数:6 被引量:63H指数:2
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于分类信心重排序的中文共指消解研究被引量:2
- 2007年
- 共指消解是自然语言处理的核心问题之一。本文针对分步消解中分类器全局信息的不足,依据分类信心对全体提及配对进行排序,优先根据可靠的分类结果对提及进行聚集或分离。实验表明,该算法在多个学习框架下显著地改善了系统的整体性能。
- 冯元勇孙乐董静李文波
- 关键词:计算机应用中文信息处理信息抽取自然语言处理聚类算法
- 中文实体关系抽取中的特征选择研究被引量:61
- 2007年
- 命名实体关系抽取是信息抽取研究领域中的重要研究课题之一。通过分析,本文提出将中文实体关系划分为:包含实体关系与非包含实体关系。针对同一种句法特征在识别它们时性能的明显差异,本文对这两种关系采用了不同的句法特征集,并提出了一些适合各自特点的新的句法特征。在CRF模型框架下,以ACE2007的语料作为实验数据,结果表明本文的划分方法和新特征有效的提高了汉语实体关系抽取任务的性能。
- 董静孙乐冯元勇黄瑞红
- 关键词:计算机应用中文信息处理实体关系抽取
- 基于非连续短语的统计翻译模型
- 本文给出了基于非连续短语的统计翻译方法,翻译的基本单元从连续短语扩展到带有间隔的非连续短语,这种方法可以更好地解决句子中词语翻译时的上下文依赖问题.在形式上,非连续短语方法和层次型短语方法相似,不同之处在于前者只允许包含...
- 张大鲲张玮董静
- 关键词:统计机器翻译
- 文献传递
- 基于非连续短语的统计翻译模型
- 本文给出了基于非连续短语的统计翻译方法,翻译的基本单元从连续短语扩展到带有间隔的非连续短语,这种方法可以更好地解决句子中词语翻译时的上下文依赖问题。在形式上,非连续短语方法和层次型短语方法相似,不同之处在于前者只允许包含...
- 张大鲲张玮董静
- 关键词:统计机器翻译
- 基于CRF模型的语义角色标注研究
- 语义分析是自然语言理解的关键技术之一。尽管经过几十年的发展,目前仍没有成熟的方法能够自动获取文本的语义信息。语义角色自动标注是对这一关键技术的初步探索。
本文首先介绍语义角色标注的定义和语料资源,其后在对现有的语义...
- 董静
- 关键词:语义角色
- 基于线性链条件随机场模型的语义角色标注
- 语义角色标注是对语义理解的一种新的探索,具有很重要的研究意义。本文提出一种基于条件随机场模型上的语义标注方法。该方法通过将句法分析树“压平”,考虑句法树中水平层次上的角色标签之间的马尔科夫依赖关系,提高了系统的精度。另外...
- 董静孙乐吕元华冯元勇
- 关键词:语义角色标注条件随机场自然语言处理
- 文献传递