国家自然科学基金(71273194) 作品数:51 被引量:650 H指数:14 相关作者: 唐晓波 房小可 肖璐 涂海丽 朱娟 更多>> 相关机构: 武汉大学 东华理工大学 九江学院 更多>> 发文基金: 国家自然科学基金 教育部人文社会科学重点研究基地度重大研究项目 抚州市社会科学规划项目 更多>> 相关领域: 文化科学 自动化与计算机技术 经济管理 社会学 更多>>
基于主题的微博二级好友推荐模型研究 被引量:25 2014年 随着社交网站用户爆炸性增长,寻找与自己兴趣相投的潜在朋友越来越困难。为了有效解决以上问题,基于社会关系理论中的同质性理论和三元闭包关系理论,分别从社会关系和内容两个维度向社交网络用户推荐志同道合的朋友。并利用LDA的扩展模型UserLDA对新浪微博用户进行兴趣主题建模,通过用户-主题概率分布矩阵计算用户相似度,以进行TopN二级好友推荐。在真实微博语料库上进行试验表明该推荐算法有较好的准确性和多样性。 唐晓波 祝黎 谢力基于特征本体的微博产品评论情感分析 被引量:48 2016年 [目的 /意义]微博平台产品评论的特征级情感分析问题具有其特殊性,为了对特征分类,解决隐式特征的识别问题,并分析特征情感,提出一种基于特征本体的产品评论情感分析方法。[方法 /过程]该方法利用构建的特征本体对特征词分类,通过计算情感词与特征的搭配权重来识别隐式特征,并构建领域情感词典和微博表情符号词典,计算微博产品评论的特征情感极性和强度。[结果 /结论]构建方法模型,通过采集微博评论数据设计实验,验证了提出方法的有效性。 唐晓波 兰玉婷关键词:本体 情感分析 大数据环境下知识融合的关键问题研究综述 被引量:13 2017年 对知识融合研究现状进行梳理,分析大数据环境下知识融合研究所需要解决的关键问题。通过对知识融合领域文献进行分析,了解本领域的研究现状,以传统知识融合的框架、算法、应用入手,探讨大数据环境下知识融合研究的新需求。分析结果显示,在融合框架上,更强调大数据环境下知识的清洗、表示和服务;在融合算法上,需考虑知识和信息的差别;在融合应用上,需考虑跨领域知识的融合。 唐晓波 朱娟关键词:大数据 知识融合 微信功能需求的KANO模型分析 被引量:24 2015年 微信是当前最流行的一种社交媒体,微信功能是否真正满足了用户需求是社交媒体研究领域关注的内容之一。研究运用KANO模型的基本理论,结合在线问卷调查,对微信功能需求进行分析。结果表明:微信用户大部分是年轻、知性、活跃的学生和企业白领;他们对微信粘性高,但大部分微信用户只对聊天、朋友圈、公众号等少数功能有需求,并且表现为一种期望质量特征;用户对大部分功能并不关注,需求感不强。最后提出了微信需更注重用户体验、把握用户隐性需求,精简功能,提供差异化服务的优化改进建议。 涂海丽 唐晓波关键词:KANO模型 用户满意度 在线商品虚假评论关键问题研究综述 被引量:6 2017年 [目的 /意义]对在线虚假评论的现有研究进行梳理,分析研究现状,明确未来研究发展方向。[方法 /过程]以CNKI和Web of Science文献为研究对象,从文献分析的视角,采用定性与定量分析相结合的方法,从虚假评论的识别方法、特征提取以及防治策略的角度,对国内外虚假评论研究的现状进行了分析,总结和概括了本领域研究的热点和存在的问题。[结果/结论]研究表明,在虚假评论的识别方法上,需加强对半监督和无监督学习的研究;在特征提取上,可考虑本体技术的应用;在防治策略上,要考虑多学科多领域的合作。 朱娟关键词:识别方法 特征提取 中文UGC信息源的本体概念抽取研究 被引量:4 2014年 【目的】实现基于UGC信息源的本体概念抽取。【方法】针对UGC信息源特征,提出一种基于语言学的细粒度词抽取组合并应用统计过滤组成概念的本体概念抽取方法,建立基于UGC信息源的概念抽取模型并对原型系统进行验证。【结果】在UGC信息源概念抽取实验中,该方法的结果比其他4组概念抽取方法的表现更为优异,准确率达68.42%,召回率达85.35%。【局限】概念抽取的测试集来自信息质量较高的UGC信息源,部分信息经过人工过滤,语料规模存在不足。【结论】概念抽取方法与技术在实现基于UGC信息源的本体概念抽取中具有一定的意义。 唐晓波 胡华关键词:概念抽取 中心词 互信息 信息熵 基于图书基因组的个性化图书推荐研究 被引量:12 2017年 网络的普及和社会化媒体的兴起为图书推荐提供了崭新的发展平台。如何改进推荐算法,使图书推荐结果更符合读者的需求,已成为相关读书网站及各领域学者关注和研究的重点。文章通过构建图书基因组来描述图书各个方面的特征,分析用户对图书基因的偏好;根据用户标注信息建立用户兴趣集,构建用户"相邻"关系;最后,提出基于图书基因组的个性化图书推荐算法。通过实验证实,该算法能有效提高推荐结果的准确度。 唐晓波 周咏微博产品评论挖掘模型研究 被引量:24 2013年 微博平台上的产品评论是用户表达其产品需求和情感倾向的重要渠道。结合微博的社会性特点构建了一个微博产品评论挖掘模型,该模型在对产品评论进行情感极性分析的基础上,把不同极性的评论进行分类研究,通过统计分析的方法,挖掘用户关注的产品特征优缺点,并将对应观点的用户感知程度进行可视化;再根据微博产品评论的特点,通过共词网络分析方法实现了对产品竞争对象的识别与分析。最后,通过实证分析,验证了该模型的可行性。 唐晓波 王洪艳关键词:情感分析 统计分析 基于在线评论的用户需求挖掘模型研究 被引量:38 2015年 用户需求挖掘是产品/服务质量提升的重要前提,在线评论真实反映了用户对产品/服务的满意与否。本文针对在线评论数据构建了一个用户需求挖掘模型。该模型首先获取关于某产品/服务的评论数据,经预处理后提取评论文本的主观句;结合构建的领域本体和依存句法分析确定该产品主题属性和相应的主观评论,按产品/服务主题属性对评论内容进行正负向分类;并运用LDA模型对用户评论进行聚类分析,展示用户重点关注主题属性的评价向量及其情感;同时运用KANO模型对分类结果进行KANO转换与评价,对评价结果进行分析,得出用户关于该产品/服务各主题属性特征需求满足情况;在此基础上提出该产品/服务改进的方向。本文以庐山旅游为例,验证了模型的可行性。 涂海丽 唐晓波 谢力关键词:KANO模型 微博中文本特征质量对检索效果的影响 2014年 【目的】通过对国内4大微博平台中特征词质量的测度,探讨其质量指标对检索效果的影响。【方法】将权重计算指标TF-IDF从特征词角度提升为特征的研究,并通过描述能力和辨别能力两个质量测度指标对国内4个主流微博平台中各特征的质量进行评估。【结果】微博中文本特征的描述能力和辨别能力对检索效果产生正向影响;各平台不同特征的质量对分类有着不同程度的影响,两种测度指标综合考虑时得到的分类效果最好。【局限】微博中的对话回复、粉丝数、关注数等特征并没有被考虑在内;对于语义研究中的特征词一词多义或者同义词的讨论并未涉猎。【结论】本研究可更好地揭示微博中各种特征影响检索效果好坏的重要程度,有助于研究者对各平台特征作用的深入理解,从而从根本上提高社会化媒体平台的检索质量。 唐晓波 房小可关键词:文本特征