吴佳楠
- 作品数:2 被引量:50H指数:2
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:国家自然科学基金教育部人文社会科学研究基金北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Word2Vec的情感词典自动构建与优化被引量:40
- 2017年
- 情感词典的构建是文本挖掘领域中重要的基础性工作。近几年,情感词典的极性标注从二元褒贬标注向多元情绪标注发展,词典的领域特性也日趋明显。但是情感类别的手工标注不但费时费力,而且情感强度难以得到准确量化,同时对领域性的过分关注也大大限制了情感词典的适用性[1]。通过神经网络语言模型对大规模中文语料进行统计训练,并在此基础上提出了基于转换约束集的多维情感词典自动构建方法;然后研究了基于词分布密度的感情色彩消歧方法,对兼具褒贬意味词语的感情极性进行区分和识别,并分别计算两种感情色彩下的情感类别与强度;最后提出基于多个语义资源的全局优化方案,得到包含10种情绪标注的多维汉语情感词典SentiRuc。实验证实该词典1)在类别标注检验、强度标注检验、情感消歧效果及情感分类任务中均具有良好的效果,其中的情感强度检验证实该词典具有极强的情感语义描述力。
- 杨小平张中夏王良张永俊马奇凤吴佳楠张悦
- 关键词:情感分析
- 评论簇在网络舆论中的情感倾向代表性研究被引量:10
- 2016年
- 【目的】验证评论簇在网络舆论中具有情感倾向代表性作用。【方法】提出基于社会网络分析的评论簇对象情感倾向性分析模型。针对网络新闻事件,以新闻的用户评论(评论总集)为语料数据,对语料数据进行结构化处理和分析,借助评论主体的形式化关系,建立具有网络节点和拓扑连接关系的知识图谱,寻找最优评论簇。以评论簇的评论主体及其对应的评论对象为主,对评论簇内的核心人物及其评论进行语义分析,计算得到评论簇情感倾向,并与对应新闻的评论总集情感倾向作对比。【结果】实验结果表明,评论簇和评论总集中的情感强度趋于一致,新闻的评论簇对新闻具有较好的情感倾向代表性,并能将网络舆情对象情感挖掘算法的性能提高58%。【局限】由于本文的评论簇对象情感倾向性分析模型在情感特征词识别和抽取方法上使用不够完善,导致少量中文分词和词性标注错误、语法依存关系错误,且未将程度词考虑在内。【结论】评论簇在网络舆论中具有情感倾向代表性作用,可提高网络舆情对象情感计算的性能,可灵活有效地降低舆情分析的时间和空间复杂度。
- 杨小平马奇凤余力莫雨婷吴佳楠张悦
- 关键词:语义网络知识图谱网络舆情