您的位置: 专家智库 > >

国家社会科学基金(08CYY016)

作品数:7 被引量:64H指数:4
相关作者:吴云芳昝红英金澎俞士汶王淼更多>>
相关机构:北京大学郑州大学西安外国语大学更多>>
发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 7篇期刊文章
  • 1篇会议论文

领域

  • 6篇自动化与计算...
  • 2篇语言文字

主题

  • 3篇消歧
  • 3篇词义消歧
  • 2篇信息处理
  • 2篇支持向量
  • 2篇支持向量机
  • 2篇情感
  • 2篇中文
  • 2篇中文信息
  • 2篇中文信息处理
  • 2篇向量
  • 2篇向量机
  • 1篇多分类器
  • 1篇多分类器集成
  • 1篇新闻
  • 1篇义类
  • 1篇语词
  • 1篇韵律构词
  • 1篇纸张
  • 1篇判定表
  • 1篇评测

机构

  • 7篇北京大学
  • 2篇郑州大学
  • 1篇西安外国语大...

作者

  • 7篇吴云芳
  • 2篇昝红英
  • 1篇郭明
  • 1篇柴玉梅
  • 1篇王淼
  • 1篇张坤丽
  • 1篇俞士汶
  • 1篇邱金萍
  • 1篇左维松
  • 1篇金澎
  • 1篇裴雨来
  • 1篇温苗苗

传媒

  • 2篇当代语言学
  • 1篇计算机研究与...
  • 1篇计算机工程与...
  • 1篇计算机工程
  • 1篇中文信息学报
  • 1篇术语标准化与...

年份

  • 1篇2011
  • 4篇2010
  • 2篇2009
  • 1篇2008
7 条 记 录,以下是 1-8
排序方式:
“纸张粉碎机”的层次结构被引量:14
2010年
现代汉语中含动复合词的层次结构是对"纸张粉碎机"类复合词深入分析的前提,关于其为[N1+[V+N2]]还是[[N1+V]+N2],目前仍无定论。文章指出很多语言材料不支持[[N1+V]+N2];然后考察了前人对[N1+[V+N2]]的批评,并指出不支持此层次的语料。最后论述韵律词层面在分析中的必要性,并得出复合词层次结构。
裴雨来邱金萍吴云芳
关键词:层次分析韵律构词
词义消歧相关术语简介被引量:1
2010年
词义消歧是计算语言学领域的基础性关键研究课题。本文介绍了与词义消歧相关的一些重要术语概念,包括词义消歧、词义区分、基于词典的词义消歧方法、有监督的词义消歧方法、词义标注语料库等。
吴云芳
关键词:词义消歧
多分类器集成的汉语词义消歧研究被引量:16
2008年
词义消歧长期以来一直是自然语言处理中的热点和难题,集成方法被认为是机器学习研究的四大趋势之一.系统研究了9种集成学习方法在汉语词义消歧中的应用.9种集成方法分别是乘法规则、均值、最大值、最小值、多数投票、序列投票、加权投票、概率加权和单分类器融合,其中乘法规则、均值、最大值3种集成方法还未曾应用于词义消歧.选取支持向量机模型、朴素贝叶斯和决策树作为3个单分类器.在两个不同的数据集上进行了实验,其一是选自现代汉语语义标注语料库的18个多义词,其二是国际语义评测SemEval-2007的中英文对译选择词消歧任务.实验结果显示,首次在词义消歧中引入应用的3种集成方法乘法、均值、最大值有良好的性能表现,3种方法的消歧准确率均高于最佳单分类器SVM,而且优于其他6种集成方法.
吴云芳王淼金澎俞士汶
关键词:词义消歧多分类器集成均值
基于SVM融合多特征的介词结构自动识别被引量:4
2009年
介词结构在汉语文本中出现频率很高,正确识别介词结构边界对句法分析、语音合成中的韵律短语划分有着重要意义。该文较为系统地探讨了汉语中常用介词的边界识别问题。利用支持向量机SVM模型,基于输出概率而不是简单的二分法来选择正确的后边界。探讨了不同的特征选择,并尝试加入语义信息等不同特征组合以提高识别准确率。对常用的68个介词进行边界识别实验,5折交叉验证的准确率达到90.95%,优于前人的识别结果。
温苗苗吴云芳
关键词:计算机应用中文信息处理支持向量机
词义消歧研究:资源、方法与评测被引量:9
2009年
词义消歧是计算语言学领域的基础性关键研究课题。本文从语言资源建设、词义消歧方法和国际语义评测三个方面概要地介绍了词义消歧研究的现状:语言资源建设主要介绍了语义词典构建和词义标注语料库建设;词义消歧方法重点介绍了有指导的机器学习方法;语义评测主要介绍了国际语义竞赛SemEval。以期了解词义消歧研究的前沿状态,促发从计算的角度来审视义项区分和词义描述,进而促进汉语词汇语义学的研究。
吴云芳
关键词:词义消歧
规则和统计相结合的情感分析研究被引量:4
2011年
基于递归分治策略基本思想,本文构建了一种新的情感分析模型并解释了模型的合理性。本文首先分析了资源和统计方法的优缺点。资源的情感倾向性分析优点在于情感词表准确,缺点是完备性较差;而统计的方法则恰恰相反。进而提出了规则和统计相结合的方法分析文本的情感倾向性,并将规则和统计相结合的情感分析方法应用于该模型,并验证了其有效性。实验表明,在数据不均衡的条件下,该方法的正确率达到了77.68%。
昝红英左维松张坤丽吴云芳
关键词:中文信息处理情感分类判定表
新闻报道文本的情感倾向性研究被引量:16
2010年
将机器学习中的经典分类方法与规则方法相结合,用以分析新闻语音文本的情感倾向,并判断其强弱。通过支持向量机分类器来研究特征选择方法及特征权重计算方法的组合对实验结果的影响。在实验过程中发现适当的结合规则后,实验结果在不同程度上都有了提高,在KNN和Bayes分类器上做了对比实验,结果证实该方法的普适性。
昝红英郭明柴玉梅吴云芳
关键词:支持向量机
Disambiguating Dynamic Sentiment Ambiguous Adjectives
Dynamic sentiment ambiguous adjectives(DSAAs) like'large,small, high,low'pose a challenging task on sentiment ...
Yunfang Wu Key Laboratory of Computational Linguistics(Peking University)
共1页<1>
聚类工具0