于淼
- 作品数:7 被引量:23H指数:2
- 供职机构:哈尔滨工程大学计算机科学与技术学院信息安全研究中心更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向微博的多实体稀疏关系数据联合聚类
- 微博中存在大量的实体及复杂的交互关系,通过联合聚类算法同时挖掘多实体的交互关系是微博数据挖掘研究的热点。针对大规模微博中多实体间的稀疏关系数据,提出一种面向多实体稀疏关系数据的高效联合聚类算法。在稀疏约束的块坐标下降框架...
- 于淼杨武王巍申国伟
- 关键词:联合聚类
- 基于扩散小波的社会网络多尺度分析被引量:1
- 2014年
- 针对社会网络中的同质性关系提出一个基于扩散小波的多尺度分析框架,通过局部相似性度量构造扩散算子,在统一的框架下对社会网络中的结构、内容、用户行为等进行多尺度分析。在合成和真实网络数据上进行实验,与典型算法的对比表明,本算法在无参数的条件下快速收敛并得到更好的结果。
- 申国伟杨武黄文廷王巍丁丽于淼
- 关键词:社会网络多尺度同质性
- 面向大规模微博消息流的突发话题检测被引量:15
- 2015年
- 突发事件在微博中迅速传播,产生巨大的影响力,因此,突发舆情受到政府、企业的广泛关注.现有的突发话题检测算法只考虑单一的特征实体,无法处理微博中新词、图片、链接等诱导的突发.面向大规模微博消息流,提出一种无需中文分词的实时突发话题检测框架模型.模型依据消息流动态调整窗口大小,并通过传播影响力度量实体的突发权值.采用高阶联合聚类算法同时对实体、消息、用户进行聚类分析,在检测突发话题的同时,得到话题的关联消息及参与用户.对比实验结果表明,算法的准确性高,能够更早地检测到突发话题.
- 申国伟杨武王巍于淼
- 关键词:联合聚类
- 基于非负矩阵分解的大规模异构数据联合聚类
- 信息网络中包含多类实体和关系.随着数据规模增大时,不同类实体规模增长不平衡,异构关系数据也变得异常稀疏,导致聚类算法的时间复杂度高、准确率低.针对上述问题,提出了一种基于关联矩阵分解的两阶段联合聚类算法FNMTF-CM....
- 申国伟杨武王巍于淼董国忠
- 关键词:聚类算法矩阵分解
- 面向微博的多实体稀疏关系数据联合聚类被引量:1
- 2016年
- 针对大规模微博中多实体间的稀疏关系数据,提出一种面向多实体稀疏关系数据的高效联合聚类算法。在算法中,为了充分利用多关系数据,提出了一种顽健的约束信息嵌入方法构建关系矩阵,降低了矩阵的稀疏性,进一步提高了算法的准确率。在稀疏约束的块坐标下降框架下,关系矩阵通过非负矩阵三分解算法同时获得不同实体的聚类指示矩阵。非负矩阵分解过程中,通过高效的投射算法实现快速求解,确保了聚类结果的稀疏结构。在人工和真实数据集上的实验表明,算法在3个指标上都具有明显提高,特别是在极端稀疏数据上的效果更加明显。
- 于淼杨武王巍申国伟
- 关键词:联合聚类非负矩阵分解
- 面向实时微博消息流的在线突发事件检测
- 微博消息的快速传播以及突发事件的敏感性使得微博成为突发事件的舆论传播中心。面向海量微博消息流的微博实时突发事件检测已经成为微博舆情监管领域重要研究课题之一。由于海量实时微博消息流以及微博消息的不规范性使得人们对实时微博消...
- 董国忠杨武王巍申国伟于淼
- 关键词:突发事件
- 基于非负矩阵分解的大规模异构数据联合聚类被引量:6
- 2016年
- 异构信息网络中包含多类实体和关系.随着数据规模增大时,不同类实体规模增长不平衡,异构关系数据也变得异常稀疏,导致聚类算法的时间复杂度高、准确率低.针对上述问题,提出了一种基于关联矩阵分解的2阶段联合聚类算法FNMTF-CM.第1阶段,抽取规模较小的一类实体中的关联关系构建关联矩阵,通过对称非负矩阵分解得到划分指示矩阵.与原始关系矩阵相比,关联矩阵的稠密度更高,规模更小.第2阶段,将划分指示矩阵作为关系矩阵三分解的输入,进而快速求解另一类实体的划分指示矩阵.在标准测试数据集和异构关系数据集上的实验表明,算法准确率和性能整体优于传统的基于非负矩阵分解的联合聚类算法.
- 申国伟杨武王巍于淼董国忠
- 关键词:异构网络联合聚类非负矩阵分解大规模数据关联矩阵