您的位置: 专家智库 > >

吴云芳

作品数:50 被引量:324H指数:12
供职机构:北京大学更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字一般工业技术更多>>

文献类型

  • 37篇期刊文章
  • 10篇会议论文
  • 1篇学位论文
  • 1篇专利

领域

  • 35篇自动化与计算...
  • 18篇语言文字
  • 1篇一般工业技术

主题

  • 14篇汉语
  • 11篇信息处理
  • 11篇消歧
  • 11篇词义消歧
  • 10篇中文
  • 8篇中文信息
  • 8篇中文信息处理
  • 6篇语义
  • 6篇句法
  • 6篇词义
  • 5篇语料
  • 5篇语料库
  • 5篇句法分析
  • 4篇语词
  • 4篇语言处理
  • 4篇自然语言
  • 4篇自然语言处理
  • 4篇向量
  • 4篇机器翻译
  • 4篇汉语词

机构

  • 49篇北京大学
  • 9篇北京信息科技...
  • 2篇郑州大学
  • 1篇北京城市学院
  • 1篇哈尔滨工业大...
  • 1篇鲁东大学
  • 1篇西安外国语大...
  • 1篇乐山师范学院
  • 1篇中国标准化研...
  • 1篇拓尔思信息技...

作者

  • 49篇吴云芳
  • 9篇俞士汶
  • 7篇张仰森
  • 4篇金澎
  • 3篇吕学强
  • 3篇万富强
  • 3篇段慧明
  • 3篇穗志方
  • 3篇石静
  • 2篇李炜
  • 2篇亓文法
  • 2篇段惠明
  • 2篇常宝宝
  • 2篇昝红英
  • 2篇裴雨来
  • 2篇徐艺峰
  • 2篇邵艳秋
  • 1篇乔春庚
  • 1篇张良
  • 1篇张良

传媒

  • 12篇中文信息学报
  • 4篇当代语言学
  • 4篇语言文字应用
  • 2篇计算机研究与...
  • 2篇北京大学学报...
  • 2篇电子学报
  • 2篇术语标准化与...
  • 1篇语文研究
  • 1篇计算机工程与...
  • 1篇计算机工程
  • 1篇计算机应用
  • 1篇语言研究
  • 1篇计算机工程与...
  • 1篇中国科技成果
  • 1篇语言科学
  • 1篇标准科学
  • 1篇第二届全国信...
  • 1篇第三届HNC...
  • 1篇第六届汉语词...

年份

  • 1篇2023
  • 1篇2022
  • 2篇2021
  • 1篇2020
  • 2篇2019
  • 2篇2017
  • 1篇2016
  • 1篇2015
  • 1篇2014
  • 3篇2013
  • 3篇2011
  • 3篇2010
  • 3篇2009
  • 3篇2008
  • 2篇2007
  • 1篇2006
  • 7篇2005
  • 3篇2004
  • 5篇2003
  • 3篇2002
50 条 记 录,以下是 1-10
排序方式:
动词性并列结构的结构平行被引量:5
2004年
本文讨论了动词性并列结构的结构平行特征:状中结构的不平行,述宾结构的平行,主谓结构的平行,音节数目的相同。可用一个复杂特征结构来描述动词短语,包括两个属性特征“结构和音节”,其中“结构”又有两个取值“述宾和主谓”。对两个动词短语,只要其中的一个属性特征相同(结构或者音节)就可形成并列。动词性并列结构表现出来的平行性可以帮助计算机自动识别并列结构的边界。
吴云芳
关键词:现代汉语动词短语状中结构
HPSG理论简介被引量:11
2003年
本文概要介绍了HPSG理论(中心语驱动短语结构语法)。表层导向、基于约束和词汇主义是HPSG的主要理论主张;特征结构是HPSG描述语法信息的主要手段,词汇类体系结构和词汇规则构成了HPSG的词汇体系;中心语——补足语规则、中心语——指定语规则等以及中心语特征原则、值传递原则等构成了HPSG的规则系统。文章最后对HPSG和GB理论进行了简要的比较。
吴云芳
关键词:句法理论计算语言学特征结构词汇
汉英双语短语信息数据库的构建
本文扼要介绍了一个汉英双语短语信息数据库的构建情况:汉语短语的描述信息;英语短语的描述信息:描述中的疑难问题;短语库的实施和应用。短语库是综合型语言知识库的有机组成部分,它的建设将为短语结构研究、句法分析和机器翻译提供强...
吴云芳常宝宝詹卫东
关键词:短语结构机器翻译
文献传递
动词对宾语的语义选择限制被引量:34
2005年
动词对论元的语义选择限制一直是自然语言处理研究领域一个备受关注的问题。本文选取现代汉语中4 6个高频的、可以带体词性宾语的动词,借助知网的名词语义分类体系,基于《人民日报》语料,考察了动词对宾语的语义选择限制,归纳成5种类型,在此基础上讨论了语义选择限制在汉语信息处理中的应用和局限,并进而讨论了上下位语义关系、部分整体语义关系在动词语义选择限制中的作用。
吴云芳段慧明俞士汶
关键词:语义关系词义消歧
“和”“与”“并”“而”连接谓词性成分时的区别被引量:15
2005年
并列连词“和”“与”“并”都可以连接动词性成分 ,“和”“与”“而”都可以连接形容词性成分 ,但它们在句法位置的分布上显现出差异 ,这种差异可以从“表述功能”得到合理的解释 :“和”“与”连接的并列结构是指称性的 ,“并”“而”连接的并列结构是陈述性的。
吴云芳
“是”字句主语和宾语的自动界定被引量:3
2002年
“是”字句是现代汉语中比较特殊的、又是比较常见的一种句子形式 ,对其主语部分和宾语部分的自动界定和标注将有助于机器翻译、信息检索、信息提取等的研究。本文通过考察语料中“是”字句的句法表现 ,总结、提取了“是”字句的自动标注规则 ,对《人民日报》一个月语料中的“是”字句进行了自动标注。实验结果表明 ,对没有逗号的句子 ,标注正确率可达到 99%以上 ;对有逗号的句子 ,标注正确率为 89%。
吴云芳段慧明俞士汶
关键词:字句浅层分析主语宾语自然语言处理
汉语篇章级小句关系的标注体系被引量:2
2015年
句际关系自动分析属于篇章语义学研究的范畴,虽然英语句际关系的研究已有大量工作,但汉语句际关系的自动分析还只是刚刚起步。该文在RST理论框架下,结合汉语特点,提出了完整的汉语篇章级小句关系标注体系。将汉语话题和逻辑关系置于同一个框架下进行描述,将小句关系划分为事件附属关系和事件逻辑关系两大类。逻辑关系又包括6个中类、15个小类。目前已在人民日报语料上完成了8 000个句子的小句关系标注。抽取出其中1 000个句子检测了双盲标注的一致性,揭示了汉语意合性语言小句关系标注的困难;并基于标注数据对关系类型进行了定量分析,指示了汉语句际关系自动分析将面临的重点和难点。
吴云芳徐艺峰王恺然
关键词:句际关系小句关系语料库标注
汉语词义自动标注研究软件平台的设计与实现
词语义项标注在自然语言处理领域占有重要地位。词义排歧知识的获取、基于排歧知识构建词义标注的语言模型,以及对所构建模型性能的评价就成为词语义项标注系统的三个核心问题,尤其是前两个问题非常重要,难度也很大。为更好地研究这些问...
张仰森俞士汶段惠明吴云芳
关键词:知识获取
文献传递
词语多义的表征
词义自动消歧长时期以来一直是自然语言处理中的热点难题。词语多义的表征主要有下面四种形式:(1)意义训释,(2)语义原语,(3)语义关系,(4)框架网络。人和计算机都是借助词语出现的上下文语境来消解词语歧义的,而上述四种语...
吴云芳刘扬俞士汶
关键词:多义词词义消歧自然语言处理
文献传递
汉语并列复句的自动识别方法被引量:5
2013年
针对汉语句际关系中分布最广泛的并列复句,提出一种自动识别的方法。通过对句子语义相似度和结构相似度的计算,使用基于词义的句子相似度计算、最大公共子串、最大谓词周边匹配长度、加重特定词语复现等方法,在广义并列关系上进行评测。最后将其中3种方法进行集成,并取得了较为理想的效果。
吴云芳石静万富强吕学强
关键词:并列复句句际关系句子相似度
共5页<12345>
聚类工具0