国家社会科学基金(11CTQ022)
- 作品数:19 被引量:302H指数:11
- 相关作者:徐健肖卓刘颖梁辰朱琳琳更多>>
- 相关机构:中山大学中国医学科学院北京协和医学院北京京东尚科信息技术有限公司更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 网络用户评论信息源选择方法研究被引量:3
- 2013年
- 针对网络用户情感分析、舆情分析领域对信息源的评价和甄别的研究较为薄弱的现状,分析影响信息源网站质量的因素,构建信息源网站评价模型,并提出运用模型确定信息源网站质量排序的具体实现步骤。实验证明,该方法优于传统的仅以网站知名度或影响力来确定信息源的方法。
- 李洁娜徐健李萱杰郭诗琪陈铱晗
- 关键词:情感分析网站
- 基于句法依赖规则和词性特征的情感词识别研究被引量:6
- 2018年
- [目的/意义]针对传统的情感词词典构造方法对新词判断准确率不够理想,领域拓展性较差等问题,提出基于句法依赖规则和词性特征的情感词识别模型。[方法/过程]以京东商城iPhone 6s的商品评论为语料,通过使用Stanford Parser句法分析工具、情感种子词典、基于评论语料的人工标注情感词典、手机对象词典等外部数据,构建基于句法依赖规则以及词性特征的情感词识别模型。[结果/结论]实验表明,该模型能有效识别手机领域中的情感词,准确率达到84.89%,且无需人工干预。[局限]情感词识别匹配模型规模偏小,模型召回率仍有进一步提升的空间。此外实验只在手机领域下进行探究,并未涉及其他领域。
- 邓淑卿李玩伟徐健
- 关键词:句法分析词性标注
- 舆情事件中评论对象的情感分析及其关系网络研究被引量:17
- 2018年
- 【目的/意义】从舆论对象的情感变化和关系变化展现舆情走向,为舆情监测和分析提供新的研究方法和研究角度。【方法/过程】文章提出舆论对象分析模型,利用依存句法分析,识别和抽取舆论对象-情感词对,进行情感分析,并对舆论对象的关系网络进行研究。【结果/结论】实验结果表明,模型能有效识别主要舆论对象及其情感词,直观地展现网民对舆论对象随时间演化的情感表达和关系认知。通过舆论对象情感变化与舆情事件发展的拟合,可为舆情监测、分析等相关研究提供新的研究视角。
- 梁晓敏徐健
- 关键词:网络舆情情感分析关系网络
- 一种基于词语相似度计算的本体映射方法被引量:6
- 2013年
- 本体映射是解决本体异构的有效手段。针对本体映射中概念相似度计算存在的不足,提出一种改进方法。将WordNet的同义词、近义词检索和编辑距离算法引入术语中心词之间的相似度判断过程,并借助新的自动权重分配方法对术语中心词和术语修饰词相似度进行集成。通过与同类典型本体映射方法对比实验证明,该方法具有良好的效果。
- 徐健方安洪娜
- 关键词:本体映射词语相似度概念相似度
- 网络评论情感分析关键技术及应用研究被引量:25
- 2017年
- 在对近年来国内外网络用户评论情感分析相关文献进行分析研究的基础上,阐述了网络评论情感分析的基本概念和研究现状;将典型的网络评论情感分析过程中的核心技术归纳为网络信息源选择技术、网络评论评级过滤技术、情感倾向性识别技术以及情感分析结果可视化技术;并从意见概览和趋势预测两个方面总结了当前网络评论情感分析在具体领域的应用研究,提出存在的问题和研究展望。
- 朱琳琳徐健
- 关键词:网络评论情感分析
- 网络商品评论的特征–情感词本体构建与情感分析方法研究被引量:35
- 2014年
- 【目的】解决情感分析领域使用通用情感词典进行情感分析时,在特定领域内无法识别领域专用情感词,以及同一情感词描述不同特征时可能表达出不同情感倾向的两个问题。【方法】提出一种基于领域专用情感词的网络评论情感分析方法。该方法构建特征–情感词本体,利用本体对网络上的产品评论进行情感分析。并与基于Senti-HowNet词典的情感分析方法进行对比。【结果】本文方法在特征层的情感倾向分析的准确率和召回率都有显著提高。【局限】本文方法中的本体需要尽可能完整的特征词集和情感词集,并且情感分析结果好坏直接依赖于本体的构建是否完善;由于网络文本的不规范性,特征词和情感词抽取以及情感分析的过程都不考虑句法结构;数据分析过程对问题进行了简化,仅考虑特征粒度的情感倾向,未考虑连词等对情感倾向有影响的其他因素。【结论】对专用情感词和通用情感词进行分类管理,解决了两个问题,情感分析结果得到提高。
- 杜嘉忠徐健刘颖
- 关键词:情感分析本体网络评论
- 基于比较句的网络用户评论情感分析被引量:2
- 2015年
- 【目的】为帮助企业识别竞争产品,挖掘有价值的信息,提出基于比较句的情感分析模型。【方法】利用基于比较句数目的热门指数和差距指数筛选热门对比产品,从比较句中抽取特征并根据情感词典计算竞争产品的特征得分。为验证模型的效果,以手机产品为实验对象,以百度搜索引擎为数据来源展开实验。【结果】实验从28对手机产品中筛选出9对热门对比产品,并可视化分析产品的特征差异。相对于以往基于文本的情感分析方法,该模型能够更好地识别竞争产品以及判断竞争产品的用户情感取向。【局限】特征抽取准确性有待进一步提高,比较句识别率存在一定的提升空间。【结论】实验结果与实际情况相符合,模型具有有效性,该方法对企业有较高的利用价值。
- 彭浩徐健肖卓
- 关键词:情感分析数据可视化自然语言处理
- 基于网络用户情感分析的预测方法研究被引量:32
- 2013年
- 网络用户情感分析领域的研究为特定领域社会行为的预测提供了新的方法和工具。本文分析了基于情感分析进行预测的逻辑基础、典型预测方法、关键技术以及当前存在的问题和发展趋势。研究发现:研究基于网络用户情感分析预测社会活动趋势的方法在政治、财经等多个领域具备应用条件;典型预测方法可归纳为以情感分析结果作为辅助依据的预测方法和以情感分析结果作为主要依据的预测方法;预测过程涉及情感分析源的选择、预测时间提前量的确定以及情感词统计处理三个关键环节;当前研究还存在网络用户情感的代表性,待分析语料的全面和正确获取,以及网络用户情感的正确分析和统计等问题,有待深入研究。
- 徐健
- 关键词:社会化媒体网络用户情感分析
- 基于网络用户评论情感计算的用户痛点分析——以手机评论为例被引量:23
- 2018年
- [目的/意义]用户痛点是用户购买决策、企业竞争策略的重要情报支撑。结合传统的情感分析过程,为用户痛点分析提供一个基于大规模数据分析的有效流程。[方法/过程]在情感分析基础上构建基于网络用户评论情感计算的产品用户痛点分析模型,从用户关注程度和用户情感两方面去测度用户痛点,提出用户痛点指数计算公式,对用户痛点进行量化分析,将结果可视化,并进行实证研究。[结果/结论]实验证明该模型抓住用户痛点的迫切程度和满足程度,用户痛点量化情况与实际用户评论较为吻合,并能在一定程度上克服传统用户评分的主观性偏差,具有一定的实用性和有效性。[局限]为提高模型应用的广泛性,有待对更多类型的产品进行实验。
- 范炜昊徐健
- 关键词:情感分析
- 网络情感词自动识别方法研究被引量:12
- 2011年
- 针对情感词识别及情感词库构建效率不高的问题,提出一种自动提取基准情感词集的方法,从词频、词的领域性情感倾向和词的情感强度三方面进行基准词筛选,再凭借目标词与正、负基准词集的不同语义相似度进行情感词的识别和情感倾向的判断,使机器能够自动完成大部分工作,提高效率,降低构建不同领域情感词库的成本。以京东商城71061条评论和卓越网1736条评论为数据集进行实验,获得的召回率为76.36%,准确率为76.94%,情感倾向判断的准确率为62.70%。
- 张清亮徐健
- 关键词:情感分析情感倾向