您的位置: 专家智库 > >

段慧明

作品数:28 被引量:389H指数:10
供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
相关领域:语言文字自动化与计算机技术文化科学自然科学总论更多>>

文献类型

  • 16篇期刊文章
  • 12篇会议论文

领域

  • 14篇语言文字
  • 13篇自动化与计算...
  • 2篇文化科学
  • 1篇自然科学总论

主题

  • 14篇语言处理
  • 14篇自然语言
  • 13篇自然语言处理
  • 9篇语料
  • 8篇知识库
  • 8篇汉语
  • 6篇现代汉语
  • 5篇语料库
  • 5篇语言知识库
  • 5篇词语
  • 4篇数据库
  • 4篇缩略
  • 4篇缩略语
  • 4篇略语
  • 3篇动词
  • 3篇信息处理
  • 3篇语言学
  • 3篇切分
  • 3篇中文
  • 3篇中文信息

机构

  • 28篇北京大学
  • 1篇华中师范大学
  • 1篇山东中医药大...
  • 1篇中国科学技术...

作者

  • 28篇段慧明
  • 24篇俞士汶
  • 16篇朱学锋
  • 3篇王萌
  • 3篇吴云芳
  • 3篇穗志方
  • 3篇张化瑞
  • 3篇孙薇薇
  • 2篇何燕
  • 2篇刘耀
  • 2篇孙斌
  • 1篇刘云
  • 1篇王惠临
  • 1篇王振国
  • 1篇周扬
  • 1篇李素建
  • 1篇孙宏林
  • 1篇李宏展

传媒

  • 7篇中文信息学报
  • 5篇语言文字应用
  • 2篇全国第八届计...
  • 1篇情报杂志
  • 1篇情报学报
  • 1篇计算机工程与...
  • 1篇术语标准化与...
  • 1篇第三届学术计...
  • 1篇第四届全国学...
  • 1篇重庆大学第二...
  • 1篇第六届汉语词...
  • 1篇第三届学生计...
  • 1篇全国第八届计...

年份

  • 4篇2008
  • 1篇2007
  • 4篇2006
  • 9篇2005
  • 2篇2004
  • 3篇2002
  • 2篇2001
  • 2篇2000
  • 1篇1998
28 条 记 录,以下是 1-10
排序方式:
中文缩略语还原技术初探
缩略语是自然语言语汇的重要组成部分,是未定义词的主要来源之一,因此,缩略语研究也是自然语言处理的一个重要课题。本项研究的最终目标是探索中文缩略语(简称)的规律,包括缩略语的生成和还原,也就是缩略语的编码和解码。本文的工作...
支流朱学锋段慧明俞士汶
关键词:自然语言处理缩略语
文献传递
非相关文献知识发现的数据基础研究——以中医药古文献语言知识库的构建为例被引量:10
2006年
非相关文献知识发现法是一种全新的、独特的情报学方法,对文献的有效使用及隐藏知识的发掘起到了较大的作用。通过对非相关文献知识发现方法的概述及其在中医研究中的应用前景的探讨,在通用语言知识库成功构建的基础上,并结合中医药文献特点提出了具体的实施方案与方法,展开了相应的工程实施,取得了显著成效,为基于非相关文献的知识发现奠定了坚实的数据基础。
刘耀段慧明穗志方
关键词:非相关文献知识发现语言知识库数据基础
中文缩略语知识库建设
缩略语是自然语言语汇的重要组成部分,是未定义词的主要来源之一,因此,缩略语研究是自然语言处理的一个重要课题。本项研究的最终目标是探索中文缩略语的规律,包括缩略语的生成和还原,也就是缩略语的编码和解码。本项研究旨在建立一个...
支流段慧明朱学锋俞士汶
关键词:自然语言处理缩略语
文献传递
《汉语高频词语法信息词典》的研制被引量:4
2004年
北京大学计算语言学研究所自 2 0 0 3年 1月起承担了国家重点基础研究973项目《汉语高频词语法信息词典》的研制任务 ,至 2 0 0 3年 9月已完成。本文详细介绍《汉语高频词语法信息词典》
朱学锋张化瑞段慧明俞士汶
关键词:综合型语言知识库
中医药古文献语料库设计与开发研究被引量:10
2008年
专业领域语料库是对专业领域文献进行自然语言处理的重要的不可或缺的基础,是对专业文本内容与意图进行深层把握的必由之路。通过对研究背景的分析,进一步明析了专业文献进行自然语言处理的必要性,并在对专业文献语料库的研究特点进行分析的基础上,深入探讨了专业语料库的设计思想及原理,同时,对语料库词类的标注信息进行了深入研究。成功地开发了针对专业领域语料库的辅助加工系统,为专业领域语料库建设提供了理论指导和技术支撑。
刘耀段慧明王惠临周扬王振国李宏展
关键词:计算机应用中文信息处理自然语言处理语料库知识工程
面向自然语言处理的现代汉语短语信息库被引量:9
1998年
传统的自然语言处理模式是“语法规则+词典”,但语言中许多词语组合不能或很难用语法规则加以描述。把这些组合作为整体收入词库中可以使语法得到简化,从而降低系统的复杂度。基于这种“大词库,小语法”的思想,本文论述了建立现代汉语短语信息库的必要性,并对建库的方法、收录的原则和信息库进行了简要的介绍。
孙宏林段慧明
关键词:自然语言处理汉语短语固定短语词语搭配词汇化计算语言学
北京大学现代汉语语料库基本加工规范(续)被引量:33
2002年
北京大学计算语言学研究所已经完成了一个有 2 70 0万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外 ,还包括专有名词 (人名、地名、团体机构名称等 )标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规模语言工程的顺利完成得益于事先制订并不断完善的规范。发表《北京大学现代汉语语料库基本加工规范》是为了抛砖引玉 ,更广泛地向专家、同行征询意见 ,以便进一步修订。
俞士汶段慧明朱学锋孙斌
关键词:词语切分词性标注汉字处理系统
大规模汉语标注语料库的制作与使用被引量:30
2000年
随着自然语言处理研究的深入开展 ,大规模语料库的作用越来越重要。自从70年代美国制作了著名的BrownCorpus以来 ,世界上已制作了各种语料库。富士通研究开发中心和北京大学计算语言学研究所合作 ,以人民日报语料为对象 ,制作大规模汉语标注语料库 ,这个语料库是世界上规模最大的标注语料库之一。
段慧明松井久仁於徐国伟胡国昕俞士汶
关键词:自然语言处理大规模语料库语言资源
词语兼类暨动词向名词漂移现象的计量分析
<现代汉语语法信息词典>建立了面向信息处理的汉语词类体系并完成了8万词语的归类,进而分类描述每个词语的详细语法属性."大规模基本标注语料库"则对数千万字文本完成了词语切分和词性标注等基本加工.以北大计算语言学研究所拥有的...
俞士汶段慧明朱学锋
关键词:自然语言处理现代汉语语料库兼类词动词名词
文献传递网络资源链接
动词对宾语的语义选择限制被引量:33
2005年
动词对论元的语义选择限制一直是自然语言处理研究领域一个备受关注的问题。本文选取现代汉语中4 6个高频的、可以带体词性宾语的动词,借助知网的名词语义分类体系,基于《人民日报》语料,考察了动词对宾语的语义选择限制,归纳成5种类型,在此基础上讨论了语义选择限制在汉语信息处理中的应用和局限,并进而讨论了上下位语义关系、部分整体语义关系在动词语义选择限制中的作用。
吴云芳段慧明俞士汶
关键词:语义关系词义消歧
共3页<123>
聚类工具0