国家自然科学基金(60675030)
- 作品数:52 被引量:351H指数:11
- 相关作者:杨炳儒宋威侯伟徐章艳胡健更多>>
- 相关机构:北京科技大学江西理工大学济南大学更多>>
- 发文基金:国家自然科学基金国家科技成果重点推广计划教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术电子电信理学机械工程更多>>
- 基于双库协同机制的隐性知识转化模型研究被引量:5
- 2008年
- 针对现有知识管理系统对隐性知识缺乏有效组织管理的现实,提出基于数据库与知识库协同的隐性知识转化模型,通过知识库引导数据库、数据库改善知识库的新思想,形成具有双库协同机制的隐性知识管理系统,使知识库在结构上具备实时维护与自我进化的能力。以知识农业为例,在农业数据库的基础上验证了模型的有效性。
- 许有志王道平杨炳儒
- 关键词:知识转化隐性知识双库协同机制知识农业
- 新型决策树构造方法被引量:2
- 2009年
- 决策树是一种重要的数据挖掘工具,但构造最优决策树是一个NP-完全问题。提出了一种基于关联规则挖掘的决策树构造方法。首先定义了高可信度的近似精确规则,给出了挖掘这类规则的算法;在近似精确规则的基础上产生新的属性,并讨论了新生成属性的评价方法;然后利用新生成的属性和数据本身的属性共同构造决策树;实验结果表明新的决策树构造方法具有较高的精度。
- 高静宋威杨炳儒徐章艳
- 关键词:关联规则决策树
- 一种高效的离线数据流频繁模式挖掘算法被引量:2
- 2009年
- 数据流频繁模式挖掘是当前数据挖掘领域中的研究热点之一,数据流连续性、无序性、无界性及实时性的特点为挖掘算法在时间及空间性能方面提出了更高的要求。数据流中模式频度的震荡现象,迫使现有算法对概要数据结构频繁维护,致使其时间、空间效率均受到较大影响。构造了具备较高空间性能的概要数据结构SP-tree,同时定义了震荡性因子χ以量化震荡信息,提出了一种高效的离线数据流频繁模式挖掘算法SPDS,有效降低了数据震荡对算法性能的影响;在处理新到数据集时,算法采取分而治之的分离映射策略,进一步提升了时间效率;同时在查询结果方面提高了部分模式的计数精度。
- 侯伟吴晨生杨炳儒方炜炜
- 关键词:数据挖掘数据流
- 超图在数据挖掘领域中的几个应用被引量:16
- 2010年
- 数据挖掘技术的进一步发展同新理论和新方法的应用密切相关。超图以图论和集合论为基础,近年来在数据挖掘领域超图理论已经得到运用。首先概述了超图的基本概念,然后重点介绍结合了超图理论的新的关联规则挖掘算法Maradbcm,以及超图在聚类、空间数据挖掘方面的运用情况。
- 崔阳杨炳儒
- 关键词:超图数据挖掘空间数据挖掘
- 面向语义的精简化多关系频繁模式发现方法被引量:2
- 2008年
- 多关系频繁模式发现能够直接从复杂结构化数据中发现涉及多个关系的复杂频繁模式,避免了传统方法的局限。有别于主流基于归纳逻辑程序设计技术的方法,提出了基于合取查询包含关系的面向语义的精简化多关系频繁模式发现方法,具有理论与技术基础的新颖性,解决了两种语义冗余问题。实验表明,该方法在可理解性、功能、效率以及可扩展性方面具有优势。
- 杨炳儒张伟钱榕
- 关键词:多关系数据挖掘
- 一种模糊认知图分类器的研究被引量:6
- 2009年
- 通过使用模糊认知图来模拟分类过程,构造了一种模糊认知图分类器,提出了它的两种模糊认知图分类模型,并在此基础上给出了使用它进行分类的推理机制。实验证明,该方法具有良好的分类性能。
- 彭珍杨炳儒刘春梅唐志刚杨珺
- 关键词:模糊认知图数据挖掘
- 宽度优先的频繁子图高效挖掘新算法被引量:1
- 2008年
- 频繁子图已成为数据挖掘领域研究的热点之一。在经典的Apriori算法的基础上,提出了一种图挖掘的新算法Apriori-Graph。首先给出了一种新的、用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可加速子图规范编码序列匹配的速度。其次,对候选子图的生成进行了规范。最后,针对频繁性检验这一瓶颈过程,给出了若干性质,从而较大地降低了候选子图频繁性判断的代价。实验结果表明,Apriori-Graph算法具有较高的挖掘效率。
- 王映龙杨炳儒宋威宋泽锋
- 关键词:数据挖掘频繁子图邻接矩阵APRIORI算法
- 基于包含索引的频繁闭序列模式挖掘的新算法被引量:1
- 2009年
- 频繁闭序列模式惟一确定全体频繁序列模式,且规模小得多。传统的闭序列模式挖掘算法对每个频繁项目都进行扩展,往往会产生大量的非闭合序列。为解决这一问题,提出了一种新的基于包含索引的频繁闭序列模式挖掘算法,其主要思想是只对闭项集进行扩展,大大减少了非闭合序列的产生。首先,论证了闭序列模式只能由闭项集组成;其次,说明了如何利用包含索引来快速发现闭项集;最后,给出了一种深度优先的挖掘频繁闭序列模式的新算法。实验结果表明,该算法具有较高的效率。
- 李晋宏杨炳儒宋威侯伟
- 关键词:数据挖掘频繁闭项集
- 一种新的频繁项集精简表示方法及其挖掘算法的研究被引量:18
- 2010年
- 频繁项集挖掘是数据挖掘研究领域的一个基本问题,其瓶颈在于频繁项集全集的结果过多,冗余现象严重.主要的解决思路是只挖掘全体频繁项集中有代表性的子集,使得这种子集或者可满足应用的需要或者可由它们导出其他项集.最大项集和闭项集便是这类解决方案中两种最典型的子集形式.在最大项集和闭项集的基础上,提出了元项集这一新的频繁项集精简表示方法.首先,证明了最大项集和闭项集都是元项集的特例,且元项集所包含的项集数目介于二者之间;其次,讨论了元项集的性质.最后,通过在闭项集挖掘算法DCI-Closed-Index的基础上引入剪枝策略,设计了一个元项集挖掘算法.实验结果表明,所提出的挖掘算法是有效的和高效的.
- 宋威李晋宏徐章艳杨炳儒
- 关键词:数据挖掘关联规则闭项集
- 差别矩阵属性约简的信息观解释被引量:6
- 2007年
- 常见的属性约简定义有三种,即基于代数观的属性约简,基于信息观的属性约简和基于HU差别矩阵的属性约简。已有文献证明这三种属性约简彼此之间不等价。王国胤教授定义了一种新的决策表信息熵计算方法,在此方法基础上给出了粗糙集理论代数观的一种新的信息观解释。最近有学者提出了一种基于新信息熵的属性约简。经深入研究,我们证明了该属性约简与基于HU差别矩阵的属性约简是等价的,从而给出了基于HU差别矩阵的属性约简的信息观解释。
- 徐章艳杨炳儒宋威侯伟
- 关键词:正区域差别矩阵信息熵