刘波
- 作品数:32 被引量:193H指数:8
- 供职机构:暨南大学信息科学技术学院更多>>
- 发文基金:广东省科技计划工业攻关项目国家自然科学基金广东省科技攻关计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- 依赖ER模型的多关系频繁模式发现方法被引量:1
- 2012年
- 为了解决多关系频繁模式挖掘面临的统计偏斜问题和效率问题,提出了基于ER(实体-联系)概念模型的方法。其以ER模型的联系集为核心,利用扩展的关系数据库SQL统计原语,在用户给定数据约束和兴趣度约束的情况下,减少多关系频繁模式的产生数量,既不需要将相关关系表做物理连接,也不会产生统计偏斜。与相关研究工作的比较,说明了利用关系数据库管理系统和ER模型实现多关系频繁模式挖掘的有效性及正确性。
- 刘波
- 关键词:数据挖掘ER模型频繁项集
- 一种条件函数依赖挖掘算法的分析与实现被引量:6
- 2012年
- 条件函数依赖(Conditional Functional Dependence,CFD)的挖掘是一种重要的数据库分析技术,它是在函数依赖(FunctionalDependence,FD)挖掘的基础上加入条件分析功能扩展而来,当前被应用于数据质量检测。CFD挖掘是在FD挖掘的基础上通过条件分析进行更细粒度的信息挖掘,其时间复杂度较高。文章详细介绍一种经典的CFD挖掘方法(即CTANE算法),对其实现方法提出了优化措施,并通过实验比较了不同实现方法的效率,得出了优化措施改进效率的结论。
- 周健昌刘波
- 关键词:数据挖掘数据质量数据清洗条件函数依赖
- 一种高效的基于刻面分类的构件检索算法研究被引量:7
- 2010年
- 如何从构件库中准确快速找到需要的构件,是每个构件库系统需要解决的一个主要问题。基于树匹配的思想通过研究构件的特点,提出了基于刻面路径匹配的算法,它使用后缀字典排序来提高查询的效率,该算法可以在保持构件查询速度的前提下,有效提高构件的查全率和查准率,实验结果证明了该算法的可行性与有效性。
- 姚全珠刘波
- 关键词:构件库刻面分类树匹配
- 基于粒子群优化算法的属性异常检测被引量:4
- 2017年
- 提出一种新的基于粒子群优化算法的属性异常检测算法。该算法利用粒子群优化算法简单、寻优速度快的优点检测属性异常,在粒子群寻找最优值的过程中发现可能是属性异常的数据,并采用Omeasure适应度评估属性异常,算法的时间复杂度是多项式级的。与全搜索检测算法相比,大幅减少了搜索范围;同时,与完全随机算法相比,采用启发式搜索规则,提高了查全率及查准率。实验结果表明,粒子群检测算法不仅执行效率高,而且保持了较高的查全率与查准率。
- 俞家宗刘波
- 关键词:异常检测
- 多关系实体链计算与近似连接查询的研究
- 2010年
- 针对多个实体集关系,提出了链接属性及实体链有关概念,研究发现了具有相同或相似链接属性的实体链计算方法。多关系之间的实体链计算是近似连接查询的关键,该研究通过分析链接属性相似度,解决多关系之间数据冲突问题,设计了2-实体链和k-实体链计算算法,并运用扩展的SQL查询语言实现实体链计算的主要过程。实体链能够应用于多关系高效查询及动态查询,而且可以获得较高的查询准确率。
- 刘波
- 关键词:相似度查询
- 基于条件函数依赖的数据库一致性检测研究被引量:9
- 2012年
- 条件函数依赖是函数依赖在语义上的扩充,可以应用于数据清洗工作,在数据库一致性的修复上应用广泛。讨论了条件函数依赖的相关语义规则,重点研究了基于条件函数依赖对违反数据库一致性元组的检测工作,并引入置信度评价机制,对相关的检测规则进行了改进。改进后的检测方法在基于多个函数依赖的检测中显示出了优越性,使得检测工作更为精简,检测标准更加明确。
- 耿寅融刘波
- 关键词:条件函数依赖函数依赖
- 数据集成中XML Schema到关系模式的转换方法被引量:3
- 2010年
- 根据XML Schema中组件的定义及组件之间的嵌套关系,建立一系列从XML Schema转换成关系模式的结构映射规则和语义映射规则。基于这些规则实现一种转换算法,从Schema中提取出关系模式,并且证明映射得到的关系模式满足4NF。结果表明得到的关系模式不仅包含了XML Schema中所有的结构和内容信息,还能保留大部分语义约束信息,减少存储冗余。
- 聂玲刘波
- 关键词:XMLSCHEMA映射规则语义约束
- 一种利用信息熵的群体智能聚类算法被引量:19
- 2004年
- 论文采用群体智能(SwarmIntelligence)的思想研究聚类问题。在Lumer和Faieta基于蚁群的聚类算法中,通过信息熵的计算与比较,改变了拾起和放下对象的规则,增加了两区域对象的合并操作,从而加快了聚类速度并减少了参数设置数目。该方法能够有效地聚集数据库的记录对象,具有一定的实际应用价值。
- 刘波
- 关键词:信息熵群体智能聚类算法数据挖掘
- 采用属性相关分析的异常数据检测方法被引量:7
- 2011年
- 为了发现数据库中的异常数据,提出了两个数据项集之间相关可信度的新概念,并研究了基于该度量的异常数据检测规则的计算算法,产生的规则适合于离散型属性孤立点的检测。在计算检测规则中,最小相关可信度阈值不需由用户指定,而是根据1-数据项集的频率确定;利用相关可信度的性质,可以减小检测规则计算算法的时间复杂度。实验结果表明,采用该方法计算获得的相关规则进行异常数据检测,不仅效率较高,而且检测的准确率、查全率也较高。
- 刘波潘久辉
- 关键词:异常数据
- 基于Ensemble的增量分类方法被引量:1
- 2008年
- 针对在维护数据挖掘模型过程中须反复计算数据集、效率较低的问题,基于Ensembles学习思想,研究增量数据集的弱分类器生成方法,根据增量数据集分类器之间的相异度提出新的组合分类算法,分析组合分类器的出错率。实验结果表明,该分类方法是有效的。
- 刘波潘久辉