您的位置: 专家智库 > >

丁伟伟

作品数:5 被引量:33H指数:2
供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
发文基金:国家自然科学基金国家社会科学基金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 5篇自动化与计算...
  • 1篇语言文字

主题

  • 5篇语义
  • 5篇汉语
  • 5篇汉语语义
  • 2篇信息处理
  • 2篇语义分类
  • 2篇色标
  • 2篇上下文
  • 2篇贪心
  • 2篇贪心策略
  • 2篇中文
  • 2篇中文信息
  • 2篇中文信息处理
  • 2篇最大熵
  • 2篇角色标注
  • 1篇语言学
  • 1篇语义标注
  • 1篇语义角色
  • 1篇语义角色标注
  • 1篇语义识别
  • 1篇数理语言学

机构

  • 5篇北京大学

作者

  • 5篇丁伟伟
  • 4篇常宝宝

传媒

  • 2篇中文信息学报
  • 1篇第四届全国学...

年份

  • 2篇2009
  • 3篇2008
5 条 记 录,以下是 1-5
排序方式:
基于最大熵原则的汉语语义角色分类被引量:12
2008年
语义角色标注是近些年来兴起的自然语言处理的一个新的研究领域。与英语方面的研究相比,汉语方面的工作还不是很充分。该文在参考已有工作的基础上,基于最大熵原则,对汉语语义角色标注中的一个方面———语义角色分类进行了深入的研究。在提出了一些新的特征之后,该文还充分利用了语义角色之间的相关性,提取语义角色的上下文特征,从而提高标记的准确率;此外,通过对不同特征的单独研究,笔者发现了不同特征取得最优值时的窗口大小差别很大。发现这一现象后,笔者设计了一种基于贪心策略的选择算法,对不同的特征选择不同的窗口大小,使得标记结果进一步提高。在综合采用了以上的策略之后,笔者的汉语语义角色分类系统可以达到95.00%的准确率,比前人有较为显著的提升。从而证明了笔者的方法是有效的。
丁伟伟常宝宝
关键词:计算机应用中文信息处理最大熵上下文贪心策略
基于语义组块分析的汉语语义角色标注被引量:23
2009年
近些年来,中文语义角色标注得到了大家的关注,不过大多是传统的基于句法树的系统,即对句法树上的节点进行语义角色识别和分类。该文提出了一种与传统方法不同的处理策略,我们称之为基于语义组块分析的语义角色标注。在新的方法中,语义角色标注的流程不再是传统的"句法分析——语义角色识别——语义角色分类",而是一种简化的"语义组块识别——语义组块分类"流程。这一方法将汉语语义角色标注从一个节点的分类问题转化为序列标注问题,我们使用了条件随机域这一模型,取得了较好的结果。同时由于避开了句法分析这个阶段,使得语义角色标注摆脱了对句法分析的依赖,从而突破了汉语语法分析器的时间和性能限制。通过实验我们可以看出,新的方法可以取得较高的准确率,并且大大节省了分析的时间。通过对比,我们可以发现在自动切分和词性标注上的结果与在完全正确的切分和词性标注上的结果相比,还有较大差距。
丁伟伟常宝宝
关键词:中文信息处理语义角色标注条件随机域
基于最大熵原则的汉语语义角色分类
语义角色标注是近些年来兴起的自然语言处理的一个新的研究领域。本文在参考已有工作的基础上,基于最大熵原则,对汉语语义角色标注中的一个方面——语义角色分类进行了深入的研究。在提出了一些新的特征之后,充分利用了语义角色之间的相...
丁伟伟常宝宝
关键词:汉字处理语义分类数理语言学
文献传递
基于多种标注单元的汉语语义角色标注研究
近些年来,由于语义角色标注对自然语言处理的很多领域很有帮助,它逐渐得到了大家的关注,国际评测和语料的建设也大大促进了这一研究的发展。按照标注单元的不同,这些研究可以分为三大类:基于词(组块)的,基于成分分析句法树的,和基...
丁伟伟
关键词:语义标注语义识别语义分类
基于最大熵原则的汉语语义角色分类
语义角色标注是近些年来兴起的自然语言处理的一个新的研究领域。本文在参考已有工作的基础上,基于最大熵原则,对汉语语义角色标注中的一个方面——语义角色分类进行了深入的研究。在提出了一些新的特征之后,本文还充分利用了语义角色之...
丁伟伟常宝宝
关键词:最大熵上下文贪心策略
共1页<1>
聚类工具0