国家自然科学基金(61003155)
- 作品数:3 被引量:54H指数:2
- 相关作者:李寿山周国栋王荣洋鞠久朋戴敏更多>>
- 相关机构:苏州大学浙江工商大学更多>>
- 发文基金:国家自然科学基金浙江省自然科学基金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向半监督情感分类的特征选择方法研究被引量:2
- 2013年
- 特征选择旨在降低高维度特征空间,进而简化问题和优化学习方法。已有的研究显示特征提取方法能够有效降低监督学习的情感分类中的特征维度空间。同以往研究不一样的是,该文首次探讨半监督情感分类中的特征提取方法,提出一种基于二部图的特征选择方法。该方法首先借助二部图模型来表述文档与单词间的关系;然后,结合小规模标注样本的标签信息和二部图模型,利用标签传播(LP)算法计算每个特征的情感概率;最后,按照特征的情感概率进行排序进而实现特征选择。多个领域的实验结果表明,在半监督情感分类任务中,基于二部图的特征选择方法明显优于随机特征选择,在保证分类效果不下降(甚至提高)的前提下有效降低了特征空间维度。
- 王志昊王中卿李寿山李培峰李培峰
- 关键词:情感分类半监督学习二部图
- 基于CRFs的评价对象抽取特征研究被引量:39
- 2012年
- 评价对象是情感分析中情感信息的一个重要组成部分。该文基于条件随机场模型,研究多种特征在评价对象抽取任务中的表现,并将特征归纳为词法、依存关系、相对位置、语义四大类别。其中,重点引入语义角色标注新特征。在实验中,我们在三个不同的数据集上考查了各个特征及其组合对系统性能的影响,作了详细地比较研究。另外,实验结果表明新提出的语义角色标注特征对评价对象抽取有很好地指示作用。
- 王荣洋鞠久朋李寿山周国栋
- 关键词:情感分析评价对象抽取语义角色标注
- 基于不平衡数据的中文情感分类
- 近些年来,情感分类在自然语言处理研究领域获得了显著的发展。然而,大部分已有的研究都假设参与分类的正类样本和负类样本一样多,而实际情况中正负类数据的分布往往是不平衡的。本文收集四个产品领域的中文评论文本,发现正类样本的数目...
- 王中卿李寿山朱巧明李培峰周国栋
- 关键词:中文信息处理情感分类
- 文献传递
- 基于非均匀DCT的H.264视频加密算法
- 视频加密通常情况下,视频数据量巨大,所以要求较高的实时性,而安全性是视频加密的关键所在。在H.264视频编码标准的框架下,提出一种新的视频加密方案,该方案利用非均匀余弦离散变换,替代通常视频编解码中的离散余弦变换(DCT...
- 杜耀刚邬宇强王国文方晓
- 关键词:H.264视频加密
- 基于CRFs的评价对象抽取特征研究
- 评价对象是情感分析中情感信息的一个重要组成部分。本文基于条件随机场模型,研究多种特征在评价对象抽取任务中的表现,并将特征归纳为词法、依存关系、相对位置、语义等四大类别。其中,重点引入语义角色标注新特征。在实验中,我们在三...
- 王荣洋鞠久朋李寿山周国栋
- 关键词:情感分析评价对象抽取条件随机场语义角色标注
- 文献传递
- 情感分类中不同主动学习策略比较研究
- 近些年来,情感分类在自然语言处理研究领域获得了显著的发展。然而,大部分已有的研究都基于大规模标注样本的分类情况。实际情况下,收集标注样本是一件费时费力的事情。本文在基于少量标注样本的基础上,研究和探讨基于主动学习的情感分...
- 居胜峰王中卿李寿山周国栋
- 关键词:情感分析
- 文献传递
- 基于句法特征的评价对象抽取方法研究被引量:18
- 2014年
- 评价对象抽取是情感分析任务中一个重要的子任务。该文使用基于条件随机场模型的监督学习方法实现英文的评价对象抽取。为了更好的捕捉评价对象和情感词之间的关系,引入句法分析用以加入丰富的句法特征提高评价对象抽取性能。实验中,我们在两个不同的数据集上考查了句法特征对评价对象抽取性能的影响,并做了详细的分析比较。实验结果表明,将句法特征应用在评价对象抽取任务中能够取得不错的效果,明显提高了评价对象的抽取召回率。
- 戴敏王荣洋李寿山朱珠周国栋
- 关键词:情感分析句法特征条件随机场