您的位置: 专家智库 > >

江苏省自然科学基金(BK20003017)

作品数:9 被引量:42H指数:4
相关作者:钱雪忠惠亮王玉荣卜凡军张长星更多>>
相关机构:江南大学更多>>
发文基金:江苏省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 9篇中文期刊文章

领域

  • 9篇自动化与计算...

主题

  • 6篇关联规则
  • 4篇频繁项
  • 4篇频繁项集
  • 4篇项集
  • 3篇数据挖掘
  • 3篇最大频繁模式
  • 3篇最大频繁项集
  • 2篇数据集
  • 2篇频繁模式树
  • 2篇模式树
  • 2篇关联规则挖掘
  • 2篇FP-TRE...
  • 2篇大数据
  • 2篇大数据集
  • 1篇隐私
  • 1篇隐私保护
  • 1篇直方图
  • 1篇数据挖掘算法
  • 1篇投影聚类
  • 1篇子空间

机构

  • 9篇江南大学

作者

  • 7篇钱雪忠
  • 3篇惠亮
  • 2篇王玉荣
  • 1篇刘渊
  • 1篇黄李国
  • 1篇王士同
  • 1篇张长星
  • 1篇卜凡军
  • 1篇陈伟琪
  • 1篇胡琳琳

传媒

  • 4篇计算机工程与...
  • 2篇计算机应用
  • 1篇广西师范大学...
  • 1篇计算机工程与...
  • 1篇江南大学学报...

年份

  • 1篇2011
  • 4篇2010
  • 2篇2009
  • 1篇2006
  • 1篇2005
9 条 记 录,以下是 1-9
排序方式:
基于向量投影的KNN文本分类算法被引量:10
2009年
针对KNN算法分类时间过长的缺点,分析了提高分类效率的方法。在KNN算法基础上,结合向量投影理论以及iDistance索引结构,提出了一种改进的KNN算法——PKNN。该算法通过比较待分类样本和训练样本的一维投影距离,获得最有可能的临近样本点,减小了参与计算的训练样本数,因此可以减少每次分类的计算量。实验结果表明,PKNN算法可以明显提高KNN算法的效率,PKNN算法的原理决定其适合大容量高维文本分类。
卜凡军钱雪忠
关键词:K-近邻文本分类高维
基于客户机/服务器模式并行关联规则的研究与实现被引量:1
2010年
为了解决并行关联规则挖掘各节点间通信量巨大以及全局频繁项集难以准确、快速得到等问题,提出了一种新的基于客户机/服务器模式的并行关联规则挖掘算法。该算法中,各客户机只需要和服务器之间传递少量的信息,而无需和其它客户机通信,降低了通信成本;服务器端利用了数据库的触发器机制,使全局频繁项集得到的过程能够自动快速实现。实验结果表明了改进后算法的有效性,该算法可以使大数据集的挖掘从不可行到可行,从困难到容易。
王玉荣钱雪忠
关键词:大数据集关联规则挖掘频繁项集
大数据集挖掘的层次二分抽样算法被引量:3
2010年
针对目前关联规则挖掘的数据集不断增大,而很多抽样算法精度不高还要解决一系列NP难问题等情况。在分析利用频繁1项集进行抽样处理的基础上,提出了高精度的基于频繁n项集平均划分的关联规则挖掘算法——EHAC算法。理论和实验都表明,EHAC能够提高数据挖掘精度,在数据平均划分的同时,尽量保证频繁n项集能够平均划分,减少了数据库扫描次数,一定程度上缩减了数据库规模。
王玉荣钱雪忠
关键词:大数据集关联规则挖掘抽样算法
关联规则中FP-tree的最大频繁模式非检验挖掘算法被引量:4
2010年
基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使挖掘过程中不需要生成条件频繁模式树也不需要超集检验。算法采用的预测剪枝策略减少了挖掘的次数,采用的求取公共交集的方式保证了挖掘结果的完整性。实验结果表明在支持度相对较小情况下,NCMFP的效率是同类算法的2~5倍。
惠亮钱雪忠
关键词:关联规则数据挖掘频繁模式树最大频繁项集
一种基于DHCPv6支持移动用户自动配置的解决方案被引量:2
2005年
无线移动的广泛应用及IPv6的发展,要求为在异构网络中移动的终端提供自动重配置.基于DHCPv6协议使用外部触发器支持移动性的方案,给出了DHCPv6的一个扩展方案,以支持终端在移动环境下的自动配置.
刘渊胡琳琳
隐私保护数据挖掘算法MASK的优化被引量:4
2009年
针对MASK算法在重构原数据支持度的指数级复杂度的缺陷,提出了一种基于集合的优化策略,得到一种新的隐私保护挖掘算法。根据集合原理,利用已知数据项推出未知数据项数目,简化了计算各数据项数目的过程,减少了重构原数据支持度过程中扫描数据库的次数,消除了算法的指数级复杂度。实验结果表明,该优化方法比原算法有更好的性能。
张长星钱雪忠
关键词:数据挖掘隐私保护关联规则最小支持度
关联规则中改进FP-tree的最大频繁模式挖掘算法被引量:3
2010年
关联规则挖掘是数据挖掘领域中重要的研究内容,最大频繁模式挖掘又是关联规则挖掘中的关键问题之一。针对已有的最大频繁模式挖掘算法存在的问题,通过对FP—Growth、FP—Max算法的分析,提出了基于改进FP—tree的最大频繁模式挖掘算法DFP—Max。该算法使用预测、剪枝的策略减少条件FP—tree个数,采用数字集匹配代替项集匹配的方式,减少超集检验的次数,并且避免了中间结果的组合连接,从而使算法达到较高的效率。实验结果表明,在支持度相对较小情况下,DFP—Max的效率是同类算法的2-5倍。
钱雪忠惠亮
关键词:关联规则最大频繁项集
关联规则中基于降维的最大频繁模式挖掘算法被引量:13
2011年
基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、产生大量候选最大频繁项集等问题,在分析FPM ax、DMFIA算法的基础上,提出基于降维的最大频繁模式挖掘算法(BDRFI)。该算法改传统的FP-tree为数字频繁模式树DFP-tree,提高了超集检验的效率;采用的预测剪枝策略减少了挖掘的次数;基于降低项集维度的挖掘方式,减少了候选项的数目,避免了递归地产生条件频繁模式树,提高了算法的效率。实验结果表明,BDRFI的效率是同类算法的2~8倍。
钱雪忠惠亮
关键词:关联规则数据挖掘最大频繁项集频繁模式树降维
基于Parzen窗的投影聚类方法被引量:3
2006年
研究表明,高维数据的聚类都隐含在低维的子空间内,而这些子空间就是把原始数据投影到某些维度上的交集,于是相应的聚类算法就变成如何寻找合适的子空间内容。在此提出了一种新的划分子空间方法——基于Parzen窗子空间划分方法,并在这基础上提出了新的投影聚类方法PCPW。通过与最新的EPCH算法的实验结果对比表明,两者聚类效果相当,但PCPW算法更简单,易于实现。
黄李国陈伟琪王士同
关键词:子空间划分直方图PARZEN窗投影聚类
共1页<1>
聚类工具0