您的位置: 专家智库 > >

孟园

作品数:6 被引量:100H指数:4
供职机构:同济大学经济与管理学院更多>>
发文基金:国家自然科学基金上海市哲学社会科学规划课题中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术经济管理文化科学更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 4篇自动化与计算...
  • 1篇经济管理
  • 1篇文化科学

主题

  • 2篇排序
  • 2篇情感
  • 2篇情感分析
  • 2篇情感倾向
  • 1篇信息特征
  • 1篇引擎
  • 1篇语义
  • 1篇语义关系
  • 1篇置信度
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇搜索引擎优化
  • 1篇索引
  • 1篇贪婪
  • 1篇推荐系统
  • 1篇中文
  • 1篇作弊
  • 1篇网络口碑
  • 1篇网页
  • 1篇网页排序

机构

  • 6篇同济大学
  • 1篇华侨大学
  • 1篇上海立信会计...

作者

  • 6篇王洪伟
  • 6篇孟园
  • 2篇王伟
  • 1篇王伟

传媒

  • 2篇系统工程理论...
  • 2篇现代图书情报...
  • 1篇中文信息学报
  • 1篇管理评论

年份

  • 2篇2017
  • 2篇2016
  • 1篇2015
  • 1篇2014
6 条 记 录,以下是 1-6
排序方式:
协同过滤推荐算法研究:考虑在线评论情感倾向被引量:33
2014年
协同过滤推荐算法通常是基于兴趣相似的用户行为来实现个性化推荐,其核心是定义用户之间的兴趣相似度.本文在传统的协同过滤推荐算法基础上,考虑在线评论对用户相似度识别的影响.在混合商品推荐中,粗粒度识别评论情感极性;而在同类商品推荐中,细粒度识别每个商品特征的情感极性.如果用户对产品的某个特征评价次数大于平均次数,表明用户对该特征较关注;如果对产品的某个特征评价低于平均评价,表明用户对该特征较挑剔.进而根据用户评论来建立用户偏好模型,用户在评论中反映出来的相似度越高,表明用户之间的偏好越一致.实验表明,同传统的协同过滤算法相比,基于在线评论情感分析的用户协同过滤算法在准确率和召回率指标上有显著提升.
王伟王洪伟孟园
关键词:推荐系统协同过滤情感分析
基于文本内容特征选择的评论质量检测被引量:4
2016年
【目的】在有效提取多维特征基础上,考察评论内容特征对评论质量检测的影响。【方法】基于评论文本的信息特征度量和情感倾向的混合性,量化并抽取评论内容特征,采用GBDT模型评估特征集合分类效果,结合贪婪式特征选择算法识别有效内容特征,分析其对评论质量检测的影响。【结果】将评论内容特征应用于评论质量检测任务中能取得较好的效果,明显提升了实验准确率和召回率。【局限】实验对象主要是搜索型产品的评论数据,未对其他享受型产品(如电影、音乐)等进行验证和比较。【结论】评论内容的信息增益、产品特征词的信息增益、评论客观情感倾向度、内容差异性对评论质量检测有明显作用。
孟园王洪伟
关键词:信息特征情感倾向
在线评论质量有用特征识别:基于GBDT特征贡献度方法被引量:12
2017年
面对海量的在线评论,有用特征识别有助于消费者选择高质量的评论,为合理决策提供支持。该文基于信息采纳模型理论,在数码相机和手机数据集上提取了四类影响评论质量的有用特征集合,以logistic岭回归和基本decision tree模型作为基准模型,并结合递归特征消除(RFE)降维方法,比较检验了GBDT模型对评论质量分类和特征降维上的表现,揭示了各特征项对评论质量分类结果的"贡献度",进而识别关键特征。实验结果表明,基于GBDT模型对评论质量分类效果较好,评论发表时间、评论者排名、关键特征数量、评论字数是影响评论质量的关键特征。
王洪伟孟园
中文评论产品特征与观点抽取方法研究被引量:8
2016年
【目的】针对中文在线评论产品特征与观点抽取问题,提出一种基于置信度排序模型的抽取方法。【方法】在改进HITS算法基础上,综合考虑候选特征观点词的关联关系和语义关系构建置信度排序模型,提取并过滤特征观点词。【结果】和基准模型相比,本文方法对中文语料的产品特征和观点抽取能达到较高准确率和召回率。【局限】仅针对产品显性特征抽取,没有考虑隐性特征的识别与抽取。【结论】利用特征词和观点词的双向增强关系和语义关系,可以有效抽取产品特征观点;情感极性过滤对提升观点词抽取准确率有较大作用。
孟园王洪伟
关键词:HITS语义关系
搜索引擎排序作弊的识别:基于文本内容和链接结构的分析被引量:2
2015年
搜索引擎排序作弊通过提高网页与搜索请求的相关性,达到提高搜索排名的目的.为此,根据作弊网页的特征,引入作弊倾向系数这一概念来衡量网页作弊的可能性.网页作弊通过多种手段实现,鉴于此本文基于网页内容本身的名词密度特征,衡量页面内容作弊的可能性,由于搜索关键词大部分为名词,超过一定名词比例阈值的页面,其内容作弊的可能性越大.根据页面的链接特征,衡量页面链接作弊的可能性,从黑名单页面通过迭代计算链接作弊系数,并根据与黑名单页面的距离设置权重.最终从上述两方面特征来综合考量页面的作弊倾向系数.选取PageRank,TrustRank,BadRank为基线实验,实验结果验证了关于检索词性分析的假设以及链接作弊检测算法的有效性.
王洪伟王伟孟园
关键词:搜索引擎搜索引擎优化网页排序文本内容链接结构
网络口碑对产品销量的影响:基于细粒度的情感分析方法被引量:42
2017年
随着在线点评系统的发展,网络口碑成为消费者购买决策的重要参考依据,并对产品销量产生影响。护肤品销量受口碑效应的影响显著,为此以护肤品为例,基于细粒度情感分析技术,从网络口碑中提取针对产品特征项的消费者主客观情感,根据词汇频数设计细粒度情感各维度的权重指数,构建细粒度综合情感指数。然后,以综合情感指数和消费者评分为情感变量,结合ARMA模型对产品的销量预测进行实证分析。与基准模型对比,发现加入了情感变量的销量预测模型提高了对数据的拟合能力,细粒度情感指数有较高的预测精度。而消费者评分在某些节点上也具有一定的预测能力,但整体预测效果并不理想。研究也表明,以月度为观察周期构建的网络口碑综合情感指数具有较好的预测效果,综合情感指数滞后1期时能提供最好的预测效果,滞后1-4期时能为销量预测起作用。
孟园王洪伟王伟
关键词:网络口碑销量预测
共1页<1>
聚类工具0