您的位置: 专家智库 > >

中国博士后科学基金(2013M530156)

作品数:3 被引量:24H指数:3
相关作者:刘铭刘远超刘秉权孙承杰吴冲更多>>
相关机构:哈尔滨工业大学教育部更多>>
发文基金:中央高校基本科研业务费专项资金中国博士后科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇聚类
  • 2篇聚类算法
  • 1篇多视图
  • 1篇信息检索
  • 1篇映射
  • 1篇置信度
  • 1篇视图
  • 1篇权值
  • 1篇权值调整
  • 1篇自组织
  • 1篇自组织映射
  • 1篇相似度
  • 1篇相似度计算
  • 1篇相似度计算方...
  • 1篇聚类技术
  • 1篇均值聚类
  • 1篇均值聚类算法
  • 1篇快速聚类
  • 1篇快速聚类算法
  • 1篇K-均值

机构

  • 3篇哈尔滨工业大...
  • 1篇教育部

作者

  • 3篇刘铭
  • 2篇刘秉权
  • 2篇刘远超
  • 1篇吴冲
  • 1篇孙承杰

传媒

  • 1篇计算机研究与...
  • 1篇计算机学报
  • 1篇智能计算机与...

年份

  • 1篇2015
  • 1篇2014
  • 1篇2013
3 条 记 录,以下是 1-3
排序方式:
基于特征权重量化的相似度计算方法被引量:8
2015年
随着信息产业的迅猛发展,聚类的无监督特性使其成为一种极为有效的分析工具.而为获得良好的聚类结果,有效及准确的相似度计算方法是其必备的前提条件.事实上,在描述数据相似度时,不同的特征显然具有不同的作用,因此有必要借助一些先验知识,例如用户提供的限制数据,来衡量特征的重要性,并将其应用于相似度计算中以获取更加准确的计算结果.传统的特征权值量化方法均忽视了两点问题:(1)限制数据在特征空间中极有可能为非均匀分布;(2)限制数据可能包含不一致性.上述问题的存在使得传统的权值量化方法无法获得准确的结果甚至无法运行.基于此,文中提出了一种新颖的特征权值量化方法用以处理上述两点问题:(1)将限制数据划分为若干个等价类,进而通过计算参数"分布系数"来均匀化数据的分布;(2)将限制数据连接为无向图,进而通过计算参数"置信度"来衡量及弱化限制数据的不一致性.之后将这两个参数结合到特征权值量化函数中以获得准确的相似度计算结果.实验结果显示:该特征权值量化方法能够结合限制数据来获取不同特征对相似度计算的贡献能力,并能应用于任何聚类算法中以提高聚类的准确度.
刘铭吴冲刘远超孙承杰
关键词:置信度
面向信息检索的快速聚类算法被引量:12
2013年
随着信息检索技术的迅猛发展,针对检索系统的改进已逐渐成为研究的热点.聚类是一种有效的改进策略,通过对检索结果进行聚类,可以使用户快速地定位到自己感兴趣的检索信息所在的类别.然而,传统的检索聚类算法要么运行效率低下,要么类别划分能力不强,使它们无法真正地用于检索系统中.针对此问题,提出了一种新颖的检索聚类算法,该算法首先通过极大极小值理论从检索返回的文档集中抽取多个聚点,并依此形成初始文档类划分结果.在此基础上,算法对初始文档类的特征集合进行细化调整以使类别的划分更加精确;同时对不满足收敛条件的文档类进行层次分裂以解决信息的分层描述问题.实验表明:此算法的时间复杂度与现有的检索聚类技术相差不多,并且由于对特征集合进行迭代调整使得类别的划分更加准确合理.
刘铭刘秉权刘远超
关键词:权值调整快速聚类自组织映射
一种改进的多视图K-均值聚类算法被引量:4
2014年
近几年来,随着互联网的发展以及大数据时代的来临,具有多种表示即多视图数据越来越多,如何将传统的单一表示的数据聚类方法应用在多视图数据被广泛研究。其中传统的K-均值聚类算法因为有效性以及对于大数据的高效性而被扩展到了多视图数据领域,本文针对最近提出的一个新的多视图K-均值聚类方法,结合co-training的思想,提出了一个改进的多视图K-均值聚类算法,并在三个标准数据集上进行了实验,同时和已有的一些方法进行了比较,结果表明了算法的有效性。
伍国鑫刘秉权刘铭
关键词:聚类多视图K-均值
共1页<1>
聚类工具0