您的位置: 专家智库 > >

杨培

作品数:5 被引量:23H指数:3
供职机构:西南财经大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学经济管理更多>>

文献类型

  • 3篇期刊文章
  • 2篇学位论文

领域

  • 3篇自动化与计算...
  • 2篇文化科学
  • 1篇经济管理

主题

  • 3篇有效性
  • 3篇领域词典
  • 2篇特征提取
  • 2篇文本分类
  • 1篇多属性决策
  • 1篇新闻
  • 1篇新闻评论
  • 1篇信息增益
  • 1篇同义词替换
  • 1篇主题抽取
  • 1篇文本挖掘
  • 1篇分词
  • 1篇分类器
  • 1篇抽取

机构

  • 4篇武汉纺织大学
  • 2篇西南财经大学
  • 1篇复旦大学

作者

  • 5篇杨培
  • 3篇夏火松
  • 1篇熊淦
  • 1篇李保国

传媒

  • 3篇情报学报

年份

  • 1篇2020
  • 2篇2016
  • 2篇2015
5 条 记 录,以下是 1-5
排序方式:
基于改进K-means聚类的在线新闻评论主题抽取被引量:15
2016年
新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先在预处理阶段增加同义词替换和自动构建领域词典的部分,改善了数据稀疏性和高维性。其次,提出了K-means改进算法,用隐藏长评论-最大距离法选初始点,解决了初始点多为离群点的问题,用方差拐点确定K值,解决了预先设定聚类个数的问题,实验发现了先用BW权重选初始点,再用新提出的BW-DF权重聚类的效果最好。最后,将改进算法与原算法的聚类效果比较,实验结果表明,改进算法准确率高,抽取新闻评论主题的效果明显。
夏火松李保国杨培
关键词:主题抽取同义词替换
线上商品评论有效性分类专业领域知识模型的构建研究被引量:3
2016年
线上商品评论有效性分类领域知识模型的构建是商品评论有效性分类的一个重要基础性工作,其直接影响分类器的精度与召回率。以往的研究大多集中于情感词典的构建以及领域术语抽取工作,对于一种专门针对线上商品有效性分类的领域知识库的构建研究较少。本文提出了一种基于信息增益技术进行文本有效性分类领域知识模型构建的半监督方法,同时构建了商品领域停用词表。通过对Amason、淘宝和京东商城iPhone系列手机评论数据利用Python语言进行有效性领域知识抽取和分类预测,实验结果发现该方法显著提高了评论有效性预测的精度。
夏火松甄化春张颖烨杨培
关键词:信息增益
基于多属性决策的文本挖掘算法评价与其在产品排名中的应用研究
互联网的发展使得用户生成内容大量增长,其中就包括文本数据。这些文本数据中包含了大量有价值的信息,尽管人们可以理解文本数据,文本数据的数量超过了人力能够处理的上限,为了充分利用这些信息,人们需要诉诸于能够自动挖掘这些信息的...
杨培
关键词:文本挖掘分类器多属性决策
文献传递
基于特征提取改进的在线评论有效性分类模型被引量:6
2015年
随着国内电子商务的蓬勃发展,各大电商网站评论量飞速增长,如何从Web大量的商品评论中挖掘出价值信息并进行有效分类对消费者和生产厂商决策有重要的影响。传统分类方法能有效地抽取商品评论中的特征及观点,但对中文评论分类仍存在一些不足。为了进一步提高商品评论分类有效性,首先,综合前人研究提出一种基于评论长度的特征提取方法,提高分类准确率;然后,设计了评论样本自动标注方法,并构建评论的有效性分类模型,改善分类效率;最后,以京东商城上爬取的1710条商品评论为例,对提出的特征提取与自动标注方法进行验证。实验结果表明,根据该方法,评论分类准确率得到明显提高。
夏火松杨培熊淦
关键词:有效性文本分类领域词典
基于改进特征提取的评论有效性分类模型
在线评论的出现使得包含有客户体验与评价信息并对企业具有重要价值的商品评论大量产生。在线评论的成功采用使得用户能够无处不在地对产品及服务分享他们的意见。通过对评论的分析与研究,消费者可以有比较地制定购买计划,生产商亦可了解...
杨培
关键词:有效性文本分类领域词典
文献传递
共1页<1>
聚类工具0