您的位置: 专家智库 > >

国家自然科学基金(61170156)

作品数:5 被引量:21H指数:3
相关作者:王挺饶岚张文文刘博谢松县更多>>
相关机构:国防科学技术大学国防科技大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 2篇语言处理
  • 2篇自然语言
  • 2篇自然语言处理
  • 1篇多文档
  • 1篇多文档文摘
  • 1篇新闻
  • 1篇新闻话题
  • 1篇语义
  • 1篇语义关系
  • 1篇情感词典
  • 1篇情感分析
  • 1篇资源建设
  • 1篇自动文摘
  • 1篇网络
  • 1篇网络信息
  • 1篇文档
  • 1篇文摘
  • 1篇规范文本
  • 1篇非监督分类
  • 1篇RESOUR...

机构

  • 4篇国防科学技术...
  • 1篇国防科技大学

作者

  • 4篇王挺
  • 2篇饶岚
  • 1篇汝承森
  • 1篇岳大鹏
  • 1篇谢松县
  • 1篇刘博
  • 1篇张文文

传媒

  • 1篇国防科技大学...
  • 1篇中文信息学报
  • 1篇计算机与数字...
  • 1篇计算机科学
  • 1篇Journa...

年份

  • 2篇2014
  • 2篇2013
  • 1篇2012
5 条 记 录,以下是 1-5
排序方式:
Construction of unsupervised sentiment classifier on idioms resources被引量:2
2014年
Sentiment analysis is the computational study of how opinions, attitudes, emotions, and perspectives are expressed in language, and has been the important task of natural language processing. Sentiment analysis is highly valuable for both research and practical applications. The focuses were put on the difficulties in the construction of sentiment classifiers which normally need tremendous labeled domain training data, and a novel unsupervised framework was proposed to make use of the Chinese idiom resources to develop a general sentiment classifier. Furthermore, the domain adaption of general sentiment classifier was improved by taking the general classifier as the base of a self-training procedure to get a domain self-training sentiment classifier. To validate the effect of the unsupervised framework, several experiments were carried out on publicly available Chinese online reviews dataset. The experiments show that the proposed framework is effective and achieves encouraging results. Specifically, the general classifier outperforms two baselines(a Na?ve 50% baseline and a cross-domain classifier), and the bootstrapping self-training classifier approximates the upper bound domain-specific classifier with the lowest accuracy of 81.5%, but the performance is more stable and the framework needs no labeled training dataset.
谢松县王挺
关键词:非监督分类资源建设自然语言处理
应用语义关系自动构建情感词典被引量:7
2014年
构建英文情感词典研究相对成熟,形成了丰富可靠的词典资源。而针对中文的研究时间短,中文情感分析词典资源较少。借鉴现有可靠的英文词典资源,提出了基于语义关系的情感词典自动构建算法,算法先从HowNet的概念中进行中文义原和词语抽取及语义分析,再利用HowNet概念中DEF中英文属性值,在英文情感词典SentWordNet中进行义原和词语情感值查询,最后根据词语和义原之间的语义关系进行词语的情感值计算。算法直接利用现有的英文情感词典,无须人工标注,生成的情感词典记录了词语的语义关系、情感极性值等多种信息,弥补了现有词典的不足。评测实验结果表明,根据算法实现的情感词典相比其他词典在准确率接近的情况下,召回率和F值最高,取得了较好的评测性能。
谢松县刘博王挺
关键词:情感分析情感词典HOWNET语义关系
一种针对新闻话题的多文档文摘技术被引量:3
2012年
多文档文摘技术能帮助用户减少不必要的阅读时间,有广阔的应用前景。该文以新闻报道为处理对象,以MMR(Maximal Marginal Relevance)文摘提取算法为基础,针对目前新闻报道往往以专题形式组织展现的特点,提出了一种基于话题的多文档文摘方法。这种方法以话题关键字为打分依据,同时考虑句子位置特征等信息对句子的重要性进行评分。该文利用TDT4的新闻报道语料对上述文摘方法进行了试验评价,将基于话题的文摘系统和两个Baseline文摘系统进行比较,取得了较好的实验结果,尤其在5%的压缩比例下有明显优势。
岳大鹏饶岚王挺
关键词:自动文摘自然语言处理新闻
网络信息中评价搭配识别及倾向性判断被引量:1
2013年
随着互联网技术的飞速发展,网络评论信息呈现爆炸式的增长,观点挖掘技术应运而生。评价对象与评价短语的抽取是观点挖掘中一项重要的任务。针对现有的基于模板方法存在人工参与过多、模板覆盖率不足、不能识别跨度较远的评价对象与评价短语等问题,提出了一种自动提取模板、利用概率进行评价搭配识别并能识别跨度较远的评价对象与评价短语的方法。通过引入同义词计算情感词的情感强度,综合考虑情感词与修饰词影响,完成倾向性判断。利用COAE2011的语料对上述方法进行了实验评价,并与两个baseline方法进行比较,取得了较好的实验结果。
汝承森饶岚王挺
不规范文本的无监督观点句抽取被引量:8
2013年
观点往往承载着文本的重要信息,观点句抽取技术旨在抽取文本中包含作者主观观点的句子,其应用越来越广泛。针对网络语言不规范的现象,文章提出了一种对不规范文本的无监督观点句抽取方法,该方法先对语料及其分词结果进行规范化处理,再通过基于词典和基于规则的方法自动构造训练样例,对SVM分类器进行训练,再使用分类器抽取观点句。使用该方法在人工标注的语料以及COAE2011电子产品语料上进行实验,取得了较好的效果。
张文文王挺
共1页<1>
聚类工具0