刘栋
- 作品数:7 被引量:66H指数:5
- 供职机构:山东青年政治学院更多>>
- 发文基金:山东省自然科学基金国家自然科学基金'泰山学者'建设工程专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于PageRank和HITS的Web结构挖掘算法研究被引量:14
- 2006年
- 在对Web结构挖掘的典型算法探讨的基础上,提出了一种PageRank算法和HITS算法相结合的改进算法,并对该算法进行了简要分析。
- 刘栋刘希玉郝婷婷
- 关键词:数据挖掘WEB结构挖掘PAGERANKHITS
- 事件关联在证据链构造中的研究被引量:1
- 2016年
- 在电子取证工作中,往往忽略对电子证据信息的预处理,从而导致电子证据冗余较大,计算分析较复杂。为解决计算机取证中存在电子证据形式化表示的困难以及数据缺失的问题,在对事件关联技术进行研究和深入分析的基础上,利用贝叶斯网络理论,提出一种基于事件关联的证据链构造方法。该方法考虑事件之间的相互影响以及序列关系,分析缺失数据的因果关系,拟合完整证据链,实现了形式化表示电子证据,并降低了证据分析的数据冗余,从而有针对性地进行数据处理和证据分析,完善了取证体制。通过实验结果分析得出,该方法实现了证据的形式化表示,减少了证据分析的数据量。
- 刘栋宁玉富
- 关键词:计算机取证贝叶斯网络证据链电子证据
- 基于Map Reduce的序列模式挖掘算法被引量:2
- 2012年
- 传统数据挖掘算法在处理海量数据集时计算能力有限。为解决该问题,提出一种基于Map Reduce的分布式序列模式挖掘算法MR PrefixSpan。在PrefixSpan算法的基础上,对模式挖掘任务进行分割,利用Map函数处理由不同前缀得到的序列模式,并行构造投影数据库,从而提高挖掘效率及简化搜索空间。采用Reduce函数对中间结果进行规约,得到全局序列模式。在Hadoop集群上的实验结果表明,MR PrefixSpan能减少数据库扫描时间,具有较高的并行加速比和较好的可扩展性。
- 刘栋尉永清薛文娟
- 关键词:并行处理MAPPREFIXSPAN算法HADOOP平台
- 引入共享近邻加权图的Chameleon算法被引量:6
- 2012年
- 针对Chameleon算法中采用距离函数度量数据点间的相似度,导致距离相近的两个点可能仅拥有很少的共同特征,最小二分实际操作困难,合并时需要人工指定阈值以及一旦合并完成后不能撤销的问题,对Chameleon算法进行改进,提出一种引入共享近邻加权图(WSnnG)的Chameleon算法。该算法以数据对象间的共享近邻数来衡量相似度,进一步构造WSnnG,再利用网络模块性评价函数指导最小二分,然后以结构等价相似度作为合并的依据,最后通过引入内聚度度量函数解决合并后不能撤销的问题。在UCI数据集及4个二维人造数据集上的实验结果表明,该算法在聚类精度和运行时间方面具有更好的效果。
- 薛文娟刘培玉刘栋
- 基于动态概率变异的Cauchy粒子群优化被引量:8
- 2007年
- 介绍了标准粒子群优化(SPSO)算法,在两种粒子群改进算法Gaussian Swarm和FuzzyPSO的基础上提出了Cauchy粒子群优化(CPSO)算法,并将遗传算法中的变异操作引入粒子群优化,形成了动态概率变异Cauchy粒子群优化(DMCPSO)算法。用3个基准函数进行实验,结果表明,DMCPSO算法性能优于SPSO和CPSO算法。
- 刘栋郝婷刘希玉
- 关键词:粒子群优化GAUSSIANSWARMFUZZYPSO
- 多粒子群协同进化算法被引量:29
- 2009年
- 针对遗传算法收敛速度慢且易于陷入局部最优,而微粒群算法存在早熟的现象,提出了一种多粒子群协同进化算法,在多个粒子群协同进化的同时,通过构建基因库,使较劣的粒子根据基因库进行遗传操作,用4个基准函数进行实验表明,算法MP-SOE3性能明显优于基本PSO算法,最后对该算法进行了推广,给出了一种基于计算智能的多群协同进化模型。
- 许珂刘栋
- 关键词:遗传算法粒子群优化协同进化多种群
- 基于大数据的统计分析模型设计被引量:6
- 2016年
- 统计是利用尽可能少的局部样本数据来发现总体规律,处理对象往往数据规模小且数据结构单一。在大数据环境下,面临海量数据的采集与统计,传统方法已无法满足大规模数据集处理。基于Hadoop系统,利用其分布式存储和并行处理机制,设计了大数据环境下的统计分析模型,从海量数据中提取出有用的信息特征,实现数据资源共享,为相关部门决策提供信息服务。
- 刘栋王黎峰张怀锋
- 关键词:大数据数据挖掘HADOOP