管恩政
- 作品数:5 被引量:33H指数:4
- 供职机构:吉林大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 双层结构的流数据聚类算法被引量:6
- 2005年
- 提出一种双层体系结构用于流数据上的聚类分析. 快速计算层采用快速但粗糙的方法得到中间结果; 精确分析层采用更加复杂的方法对中间结果进行深入分析, 用于发现复杂的聚类. 实验结果显示, 这种结构在满足流数据快速分析要求的基础上能够得到更好的聚类结果.
- 王喆周春光周东滨管恩政
- 关键词:流数据聚类
- 用育种算子改进遗传算法被引量:12
- 2005年
- 为解决遗传算法求解一些特殊问题时容易出现的未成熟收敛问题, 提出了在遗传操作中加入育种算子的方法, 以改进传统遗传算法。在讨论生物工程中育种方法的基础上, 给出了育种算子的定义和原理分析证明。育种算子能提高个体进化的概率, 且不会出现由高概率变异引起的群体退化现象。计算机模拟实验结果表明, 加入育种算子可以明显提高算法性能。
- 常晓宇周春光管恩政梁艳春徐秀娟王喆
- 关键词:遗传算法
- 快速频繁序列模式挖掘算法被引量:7
- 2005年
- 为解决从数据库中挖掘长模式可能遇到较高的计算复杂度问题,提出一种新的算法FFSPAN.传统上,要判断一个序列是否频繁,需要在原数据库中判断整个序列是否频繁;而算法FFSPAN是通过在序列数据库中寻找一个频繁项或一个频繁项集来代替寻找一个完整的频繁序列,而且FFSPAN算法每次扫描的数据库都是迅速减小的,这使得算法在挖掘的序列模式越长时越有效.在标准测试数据集上的实验结果表明,FFSPAN算法非常有效.
- 管恩政常晓宇王喆周春光
- 关键词:数据挖掘
- 频繁序列模式挖掘算法被引量:6
- 2005年
- 为解决从数据库中挖掘长模式和支持度较低时可能遇到计算复杂度较高的问题,提出一种新的算法———EFSPAN(EffectiveFrequentSequentialPAtterNminingalgorithm)。算法采用了深度优先挖掘策略,并将基于前缀序列格的深度优先遍历与两种高效的剪枝策略相结合。实验结果表明:新算法在模式较长和支持度较低时,能使搜索空间中60%以上的节点免被搜索;从而大大缩小了搜索空间,降低了序列模式挖掘算法的计算复杂度。
- 管恩政周春光王喆徐秀娟
- 关键词:数据挖掘
- 序列模式挖掘算法研究
- 数据挖掘,也可以称为数据库中的知识发现,是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程。序列模式挖掘(Sequential Pattern Mining)是指挖掘基于时间或者其它顺序的出现频率高的模...
- 管恩政
- 文献传递