国家自然科学基金(61103089)
- 作品数:6 被引量:55H指数:4
- 相关作者:邱立坤夏军石静吴云芳吕学强更多>>
- 相关机构:北京大学鲁东大学沈阳师范大学更多>>
- 发文基金:国家自然科学基金教育部人文社会科学研究基金国家高技术研究发展计划更多>>
- 相关领域:语言文字自动化与计算机技术更多>>
- 郾城方言的两种小称变调和音步模式--兼论亲密与音长的可能关联被引量:3
- 2014年
- 郾城方言存在两种小称变调:高降调和低升调。在亲属称谓词中,高降调多为成年人和无亲缘关系的人使用,表示讨好和拉近关系,听感上短促生硬;低升调多为儿童和有亲缘关系的人使用,表示喜爱亲密,听感上长而自然。在亲属称谓词重叠变调中,存在两种不同的音步模式:扬抑格和抑扬格。扬抑格表现为左重右轻,抑扬格表现为左短右长。郾城方言可能分别使用了"高"和"长"两种手段表示两种不同性质的小称。
- 张慧丽
- 关键词:亲密音高音长
- 基于大规模语料库的汉语词义相似度计算方法被引量:25
- 2013年
- 词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用。该文研究了基于大规模语料库的汉语词义相似度计算方法,系统地比较分析了上下文特征权值的选择、向量相似度计算方法、基于窗口和基于依存关系的表征形式、新闻语体和网络语体的差异。实验结果表明,在网络语言语料上,基于窗口选取上下文特征,用互信息PMI来计算权值,采用cosine来计算相似度,取得了最好的词义相似度结果。
- 石静吴云芳邱立坤吕学强
- 基于语料库的汉语同义词语体差异定量分析被引量:9
- 2012年
- 通过分析语体差异大的同义词,可以了解语体之间的差异。本文采用定量分析的方法,计算出1343对具有显著口语、书面语语体差异的同义词。通过对这些词对的调查分析可知:词性上,语体差别最大的同义词中动词最多;重叠、词缀、古汉语遗留词汇在同义词中所占的比重都较小;若一对同义词有音节上的差异,则口语倾向于为单音节,书面语倾向于为双音节。本文的调查结果对语言教学以及教材编写都有一定的启示。
- 张文贤邱立坤宋作艳陈保亚
- 关键词:同义词语体差异对外汉语教学
- 基于依存语法构建多视图汉语树库被引量:10
- 2015年
- 树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的短语结构功能和层次信息,从而可以在不增加标注工作量的前提下获得更多语法信息。基于该体系,构建了北京大学多视图汉语树库(PMT)1.0版,含有64 000句、140万词,支持短语结构语法和依存语法两个视图。
- 邱立坤金澎王厚峰
- 关键词:依存语法
- 凸显例外与淡化例外——“全称否定式+‘只’[ ]”构式的逻辑与认知分析被引量:5
- 2014年
- 范围副词"只"在逻辑上只与部分否定式兼容,但实际上也常与全称否定式合用。实例分析显示,这种看似违反逻辑的句式具有强烈的表达效果,而且具有两种迥异的表达功能——凸显例外、淡化例外。句式并不否定句子的真值条件,其中"只"限定部分也受到更多的限制。因此可以将之视作一种特殊的构式。其强烈表达效果是语用否定与显著对比决定的,其不同的表达功能可以从修辞机制、认知扫描、焦点调控等多个角度得到解释。
- 夏军
- 论虚量和实量——兼论其与约量、确量的关系被引量:3
- 2015年
- 文章从分析"很"与含数量词语的动词短语组合中数量词语所受的语义限制条件入手,对虚量和实量的概念进行了重新阐释,并厘清了其与约量、确量的关系。在此基础上,解释了汉语学界之前在相关研究中提出的"不定量"条件所不能解释的一系列现象。文章认为虚量和实量不是单纯的语义范畴,而是介入了语用因素的句法语义范畴。
- 夏军