国家自然科学基金(60675035)
- 作品数:1 被引量:8H指数:1
- 发文基金:北京市自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 主客观识别中的上下文因素的研究
- 主客观判别是观点分析中的一个基本问题。在本文中,我们通过4组对比实验,分析了上下文信息对于主客观判别的影响。从实验中我们得出的结论是:引入上下文信息能够对主客观分类性能产生影响,但简单的信息引入方法反而会降低分类的准确度...
- 蒙新泛王厚峰
- 关键词:情感分析机器学习算法
- 文献传递
- 面向产品评价信息的观点词自动识别(英文)
- 自动识别产品评论的观点词是产品观点挖掘的基础。观点词的识别本质上可以转化为二元分类,很多分类器可以直接使用,但通常都需要足够的训练数据。本文针对标注语料规模较小的问题,研究了通过半指导的学习方法迭代学习未标语料的观点词。...
- 王波王厚峰
- 关键词:情感分析文本挖掘
- 文献传递
- Predicting Chinese Abbreviations from Definitions:An Empirical Learning Approach Using Support Vector Regression被引量:8
- 2008年
- 用汉语,短语和命名实体在情报检索起一个中央作用。然而,缩写使基于关键词的途径更少有效。这篇论文介绍一条实验学习途径给中国缩写预言。在这研究,每缩写作为相应定义(扩展形式) 的一种减少的形式被拿,并且缩写预言在缩写候选人之中作为一个得分并且评价的问题被形式化,它自动地从相应定义被产生。由为得分采用支持向量回归(SVR ) ,我们能和他们的 SVR 价值获得多重缩写候选人,它被用于候选人评价。试验性的结果证明 SVR 方法比缩写预言的流行启发式规则更好表现。在缩写预言,另外, SVR 方法超过隐藏的 Markov (唔) 。这篇文章(doi:10.1007/s11390-008-9156-5 ) 的联机版本包含增补材料,它对授权用户可得到。
- 孙栩王厚峰王波
- 关键词:中文信息处理支持向量回归
- 基于自学习策略的产品特征自动识别(英文)
- 本文主要考察只有规模很小的标注语料可用时,如何进行产品特征的自动识别。特别地,产品特征应按句子进行识别,因此识别过程可看为二元分类问题。本文中产品特征候选用二值向量表示,并用朴素贝叶斯分类器进行分类。训练语料足够大时,仅...
- 王波王厚峰
- 关键词:情感分析文本挖掘
- 文献传递
- 基于特征自动选取的汉语词义消歧
- 自然语言处理的许多问题都可以归结为分类问题,汉语词义消歧是一类典型的分类问题。在分类问题中,特征的选择至关重要。通常情况下,特征的选择由人工直接确定。这样的选取方式,要求选取者对于分类问题本身和机器学习模型的特点都有比较...
- 何径舟王厚峰
- 关键词:词义消歧
- 文献传递