您的位置: 专家智库 > >

王煜

作品数:5 被引量:31H指数:3
供职机构:河海大学计算机及信息工程学院更多>>
发文基金:国家重点基础研究发展计划江苏省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 4篇数据挖掘
  • 2篇搜索
  • 2篇频繁项
  • 2篇频繁项集
  • 2篇频繁项集挖掘
  • 2篇维数
  • 2篇项集
  • 2篇聚类
  • 2篇高维
  • 2篇高维数据
  • 1篇优先搜索
  • 1篇深度优先搜索
  • 1篇数据集
  • 1篇搜索方法
  • 1篇频繁项集挖掘...
  • 1篇子空间
  • 1篇子空间聚类
  • 1篇子空间聚类算...
  • 1篇最大频繁项集
  • 1篇最大频繁项集...

机构

  • 5篇河海大学
  • 5篇南京航空航天...

作者

  • 5篇王建东
  • 5篇王煜
  • 5篇陈慧萍
  • 1篇叶飞跃

传媒

  • 3篇计算机仿真
  • 1篇计算机工程与...
  • 1篇Transa...

年份

  • 1篇2007
  • 3篇2006
  • 1篇2005
5 条 记 录,以下是 1-5
排序方式:
高维数据挖掘算法的研究与进展被引量:11
2006年
生物信息学和电子商务应用的迅速发展积累了大量高维数据,对高维数据的挖掘变得越来越重要,一般的数据挖掘方法在处理高维数据时会遇到维灾的问题,同时传统相似性度量在高维空间中也变得没有意义。文章从频繁项集挖掘、聚类、分类等三个方面对最新的高维数据挖掘算法的现状进行了综述,对这些算法如何解决高维数据挖掘存在的问题进行研究。
陈慧萍王煜王建东
关键词:数据挖掘高维数据挖掘聚类
子空间聚类算法的研究新进展被引量:4
2007年
高维数据聚类是聚类技术的难点和重点,子空间聚类是实现高维数据集聚类的有效途径,它是在高维数据空间中对传统聚类算法的一种扩展,其思想是将搜索局部化在相关维中进行。该文从不同的搜索策略即自顶向下策略和自底向上策略两个方面对子空间聚类算法的思想进行了介绍,对近几年提出的子空间聚类算法作了综述,从算法所需参数、算法对参数的敏感度、算法的可伸缩性以及算法发现聚类的形状等多个方面对典型的子空间聚类算法进行了比较分析,对子空间聚类算法面临的挑战和未来的发展趋势进行了讨论。
陈慧萍王煜王建东
关键词:数据挖掘聚类高维数据集子空间
INTERNET INTRUSION DETECTION MODEL BASED ON FUZZY DATA MINING被引量:1
2005年
An intrusion detection (ID) model is proposed based on the fuzzy data mining method. A major difficulty of anomaly ID is that patterns of the normal behavior change with time. In addition, an actual intrusion with a small deviation may match normal patterns. So the intrusion behavior cannot be detected by the detection system.To solve the problem, fuzzy data mining technique is utilized to extract patterns representing the normal behavior of a network. A set of fuzzy association rules mined from the network data are shown as a model of “normal behaviors”. To detect anomalous behaviors, fuzzy association rules are generated from new audit data and the similarity with sets mined from “normal” data is computed. If the similarity values are lower than a threshold value,an alarm is given. Furthermore, genetic algorithms are used to adjust the fuzzy membership functions and to select an appropriate set of features.
陈慧萍王建东叶飞跃王煜
一种高效的最大频繁项集挖掘算法DFMFI-Miner被引量:1
2006年
分析最大频繁项集和完全频繁项集的关系,提出了一个挖掘最大频繁项集的高效算法DFMFI M iner(The M iner Basedon D epth-F irst Search ing forM in ingMaximal Frequent Item sets),采用深度优先方法搜索项集空间,采用垂直位图及一定的压缩方法对表示事务数据库并进行约简,并采用多种有效剪枝策略和优化策略,提高了算法的效率。在多个数据集上进行了实验,实验结果表明该算法特别适于挖掘具有长频繁项集的数据集。
陈慧萍王建东王煜
关键词:数据挖掘深度优先搜索频繁项集最大频繁项集
频繁项集挖掘的研究与进展被引量:15
2006年
挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,所以提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。该文从频繁项集生成过程中解空间的类型、搜索方法和剪枝策略、数据库的表示方法、数据压缩技术等几个方面对频繁项集挖掘的基本策略进行了研究,对完全频繁项集挖掘、频繁闭项集挖掘和最大频繁项集挖掘的典型算法特别是最新算法进行了介绍和评述,并分析了各种算法的性能特点,指出其适于哪种类型的数据集。最后,对频繁项集挖掘算法的发展方向进行了初步的探讨。
陈慧萍王建东王煜
关键词:数据挖掘频繁项集搜索方法剪枝策略
共1页<1>
聚类工具0