张璐
- 作品数:2 被引量:3H指数:1
- 供职机构:天津大学软件学院更多>>
- 发文基金:天津市科技计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于网格密度和距离信息特征的聚类算法被引量:3
- 2009年
- 真实数据集通常密度分布不均,多数基于网格和密度的聚类算法采用的单调性搜索方法难以形成有效聚类.为此,文中提出了基于网格密度和距离信息特征的聚类算法(GDD).该算法将数据空间划分成网格单元,并构建基于簇中心距离信息的跃迁函数,通过考察局域范围内网格单元的密度跃迁比,并比对计算出的当前网格单元的跃迁函数值,以决定是否继续扩展和增长聚类簇规模.具体的跃迁函数在真实和模拟集上的实验结果表明:GDD算法能够发现任意形状的簇,对噪音数据不敏感,且具有线性于网格数目的时间复杂性,适合对大规模真实数据集的聚类.
- 戴维迪张璐王文俊侯越先
- 关键词:聚类网格
- 一种不同的基于数据分区的并行构建密度树聚类算法(PCDTC)
- 2008年
- 传统的聚类算法在全空间下的聚类过程倾向于输出单一的聚类结果,高维数据在不同的子空间多视图下往往呈现不同的数据结构。文中引入空间的正交化方法实现在不同子空间上的并行化,构建密度树聚类,以提供对数据集在多维子空间视图下聚类结果的多样性观测,通过F-measure值引导用户确定不同子空间中感兴趣的聚类结果。真实数据集上的实现结果证明了上述方法的有效性。
- 张云鹏张璐翟正军马春燕戴维迪
- 关键词:并行处理数据处理聚类