您的位置: 专家智库 > >

徐小松

作品数:2 被引量:23H指数:2
供职机构:常州大学更多>>
发文基金:江苏省研究生培养创新工程项目国家自然科学基金江苏省科技厅基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇水军
  • 1篇索引
  • 1篇特征码
  • 1篇子集
  • 1篇网络水军
  • 1篇文本
  • 1篇文本相似度
  • 1篇相似度
  • 1篇聚类
  • 1篇聚类算法
  • 1篇基于文本
  • 1篇CURE算法
  • 1篇博文
  • 1篇层次聚类
  • 1篇层次聚类算法

机构

  • 2篇常州大学

作者

  • 2篇叶施仁
  • 2篇杨长春
  • 2篇徐小松
  • 2篇周猛

传媒

  • 1篇微电子学与计...
  • 1篇计算机仿真

年份

  • 1篇2014
  • 1篇2013
2 条 记 录,以下是 1-2
排序方式:
基于文本相似度的微博网络水军发现算法被引量:11
2014年
微博中水军发表的评论内容具有重复或者相似性,提出了基于文本相似度的微博网络水军发现算法.评论内容可以用特征码来表示.特征码再通过高效的B-Tree来索引,使整个系统具有极高的处理效率.根据水军发帖的重复性或者相似性很高的特点,通过对多个相同或相似的评论内容进行统计分析找出出现次数频繁的用户,初步定义为水军.再对这些用户的评论内容进行分析,发现他们的评论内容基本上都是具有重复性.试验表明,该方法能够准确、有效地找出水军账户.
杨长春徐小松叶施仁周猛
关键词:特征码索引文本相似度
基于改进CURE算法的微博热点话题发现被引量:12
2013年
由于微博平台的信息量大,为对博文热点进行准确识别,本文提出了一种基于经典CURE聚类算法的改进算法来发现微博热点话题。本文选取了20391条中文微博作为样本数据集,通过将博文稀疏矩阵化达到将高维数据降维的效果,很大程度上提高了计算的精度和速度。从选取CURE层次聚类的代表点出发,将代表点转换为博文种子集,同时调节收缩因子,加大排除博文的异常点,利用CURE层次聚类算法的思想设计了改进的CURE算法来发现微博热点话题,通过实验发现改进CURE层次聚类算法能够将数据集中的74.65%作为孤立点,更好的提高了算法的精度,同时准确地抓住长尾效应的"头部",能够更加直观的发现微博热点话题。
杨长春周猛叶施仁徐小松
关键词:层次聚类算法
共1页<1>
聚类工具0