吉林省自然科学基金(19990528)
- 作品数:7 被引量:78H指数:5
- 相关作者:李雄飞苑森淼谢忠时刘光远臧雪柏更多>>
- 相关机构:吉林大学长春理工大学长春税务学院更多>>
- 发文基金:吉林省自然科学基金国家自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 用于粗糙集约简的并行算法被引量:5
- 2006年
- 通过对数据挖掘粗糙集约简算法的研究,提出一种基于区分能力指数的信息系统数据划分思想.先将系统按属性区分能力分成若干子表,再由子表的约简求原系统的约简,这种思想较好地简化了布尔函数的化简过程.根据该思想设计了一个属性约简并行算法,并利用Petri网模拟工具CPN Tools对算法的负载平衡进行了分析,通过实验与相应的串行算法在时间上进行了对比,实验结果显示,该算法对于对象较多的大规模系统具有较高的效率.
- 孙涛董立岩李军张羽翔
- 关键词:数据挖掘粗糙集属性约简
- 基于项目属性的相联规则提取被引量:7
- 2002年
- 相联规则是数据库知识发现领域的重要方法之一 ,用于发现满足用户指定最小支持度和最小信任度阈值的规则 .其中 ,最小支持度阈值确定了研究数据集的规模 ,最小信任度阈值用来衡量一个规则可靠性 .在通常的支持度 /信任度框架下 ,用户只能给出一对最小支持度和最小信任度阈值 ,因此 ,对于所有数据项均采用统一标准处理 .但是 ,实际数据库中的数据项目具有各自的特点 ,该文旨在根据项目的属性特征 ,通过模糊综合评判 ,决定项目合理的最小支持度阈值 ,进而确定各个项目的支持度区间 ,达到在一次数据挖掘中同时发现频繁规则和稀有规则的目的 .由于基于最小信任度的规则提取具有冗余性 ,文中提出规则前件和后件的重要程度对比的思想 ,借助主观判断去除冗余规则 ,从而挖掘出尽可能接近自然的完全规则 .
- 李雄飞苑森淼王爱军郇丹丹
- 关键词:重要度对比度超市数据库
- 相联规则增量算法研究被引量:5
- 2002年
- 相联规则模型可以用于在海量数据库中发现有价值的知识 ,各种求解相联规则的算法都需要较大的计算量 .随着时间推移 ,数据库中的数据也随之发生变化 .由于原先发现的规则已经过时 ,需要重新在数据集中挖掘规则 .本文通过向数据库中不追加数据的方法研究孕育在数据库中的相联规则变化情况 .在借鉴 FUP等算法的基础上 ,充分利用前次挖掘中获得的有关信息 ,提出用于再次挖掘的相联规则增量算法 Super FU P.该算法核心思想是更多地注重新增数据集 ,有效利用前次挖掘信息 ,仅仅对整个数据库扫描一次就能达到求解更新相联规则的目的 ,提高了相联规则增量算法的效率 .
- 李雄飞臧雪柏刘光远苑森淼
- 关键词:数据挖掘相联规则数据库
- 基于粗集理论的约简算法被引量:29
- 2003年
- 在基于属性重要性和基于分辨矩阵两种算法的基础上,提出了一种同时满足属性重要性和频度的启发式约简算法RedFreSigni。该算法的基本思想是:以属性的核为基础,把核和用户偏好集同时作为属性近似约简的一部分,以频度作为选择属性的启发信息可同时生成计算属性的频度信息与不可分辨矩阵,减少了计算时间。在此基础上进而提出了基于规则支持度和置信度的决策挖掘算法,该算法能有效提取出用户感兴趣的规则。
- 李雄飞谢忠时李晓堂李军
- 关键词:约简算法粗集理论分辨矩阵数据挖掘关联规则知识表达
- 基于访问频率的Hash树被引量:5
- 2003年
- Hash树是一种常用的数据结构。当Hash树不能完全装入内存时,会增加缺页中断次数,导致算法效率下降,为此本文研究并提出了根据项集的联合概率生成Hash树的方法。按访问频率将Hash树结点数据顺序地排放在线性空间中。这种数据存储方式既能适应操作系统中的程序局部性特征,又能达到减少I/O次数、提高数据存取效率的目的。
- 臧雪柏陈思国王峥
- 关键词:HASH树数据结构
- 图像数据挖掘模型与方法被引量:21
- 2002年
- 利用传统的相联规则思想 ,结合图像数据的特性 ,提出了三维相联规则模型。在模型中着重强调了形状、颜色、空间位置三者之间的依赖程度 ,并在此基础上提出了图像数据挖掘方法。
- 李雄飞宋海玉谢忠时任岩苑森淼
- 关键词:多媒体图像数据挖掘相联规则
- 二次挖掘相联规则算法被引量:7
- 2002年
- 通过研究、分析FUP等算法 ,提出用于二次挖掘相联规则的算法SuperFUP。该算法更多关注的是新增数据 ,只对整个数据库扫描一次就能在变更的数据中发现相联规则 ,从而提高了算法效率。
- 李雄飞刘光远郭励焕苑森淼侯天伦
- 关键词:数据挖掘相联规则数据库