张艳
- 作品数:3 被引量:14H指数:3
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于艺人画像的歌曲点播量预测被引量:4
- 2017年
- 用户画像可以用于用户相关事件的预测。在本文中,我们探索对用户画像的建模中结合外在因素的变化,对用户相关行为进行预测。在实验方面,我们以阿里音乐用户的历史播放数据为基础,结合外在主要相关事件,对艺人进行多维的画像,进而预测某个时间段内艺人的歌曲点播量,挖掘出即将成为潮流的艺人,从而实现对一个时间段内音乐流行趋势的准确把控。实验结果表明,与传统的机器学习方法和时序模型方法相比,我们的算法具有很高准确率,且具有简洁,泛化能力强的特点。
- 吴桂平侯晓琴王冰周军张艳颜永红
- 关键词:ARIMA时间序列
- 基于CNN-SVM和转发树的微博事件情感分析被引量:4
- 2017年
- 基于微博的情感分析近几年获得了广泛的关注,但是通常是对微博上的电影或者产品的评论。我们的研究目标是针对微博上的热点事件的分析,将这些事件的评论分为正向或者负向,将微博用户的评论进行分类有利于辨别公众对于这个事件的普遍看法。本文提出了一个基于卷积神经网络的混合模型:CNN-SVM,用于对事件的评论进行分类。其次,根据微博用户的转发行为,我们提出了一种新的数据结构——转发树,用以解决评论中的一些分类混乱情况。实验结果表明CNN-SVM确实提高了情感分类的正确率,新提出的转发树结构在对真实世界的情感倾向性的逼近中也是十分有效的。
- 涂曼姝张艳颜永红
- 关键词:情感分析
- 基于词矢量相似度的短文本分类被引量:6
- 2014年
- 互联网中出现的短文本内容短小,相互共享的词汇较少,因此在分类过程中容易出现大量的集外词,导致分类性能降低。鉴于此,提出了一种基于词矢量相似度的分类方法,首先利用无监督的方法对无标注数据进行训练得到词矢量,然后通过词矢量之间的相似度对测试集中出现的集外词进行扩展。通过与基线系统的对比表明,该方法的分类正确率均优于基线系统1%-2%,尤其是在训练数据较少的情况下,所提出的方法的正确率相对提高10%以上。
- 马成龙姜亚松李艳玲张艳颜永红