潘久辉 作品数:65 被引量:171 H指数:8 供职机构: 暨南大学 更多>> 发文基金: 广东省自然科学基金 广东省科技攻关计划 广东省教育部产学研结合项目 更多>> 相关领域: 自动化与计算机技术 文化科学 社会学 经济管理 更多>>
规则评估方法与数据质量挖掘系统 被引量:4 2009年 为从数据挖掘结果中获得真正有用的规则,探讨了评估规则的度量,提出了度量关系的新概念,并应用于发现与评估有用规则集的算法中。经过度量函数之间的相关分析,确定适合的度量,并据此对规则进行兴趣度评估,指导用户对有用规则的选择。此外,为了解决数据集成系统中存在"垃圾"数据的问题,提出了数据质量挖掘与控制系统框架,将数据挖掘规则应用于数据质量管理中。使用经过评估筛选得到的规则,能够检测数据库中的异常和不完整数据,解决数据集成过程中部分数据质量问题。通过企业信息集成实例,说明了规则评估及应用方法的有效性。 刘波 潘久辉 刘佩珊关键词:数据挖掘 数据质量 Mbase的文件管理和存贮结构 被引量:2 1995年 本课题介绍了即将问世的Mbasc-I的体系结构,重,点对外磁盘存系统的类和对象的存贮组识和输入输出管理,以及存贮结构进行了探讨。图6.参3。 谢建国 潘久辉 李仁发关键词:多媒体数据库 哈希函数 文件管理 基于推进策略的遗传分类方法研究 被引量:1 2005年 应用遗传方法产生“弱”分类器,按照Boosting(推进)的思想,改变每一代遗传操作中训练实例的权重,并以整体结合方式确定未在训练集中的实例类型,有效地改进了遗传分类算法。 刘波 潘久辉关键词:遗传算法 基于数据库日志的变化数据捕获研究 被引量:19 2012年 变化数据捕获方法是数据集成基础设施的战略组成部分,不断推动ETL、EAI等技术的发展.许多数据库厂商都提供了自己的CDC(Change data capture)产品,但只限于针对本身的数据库系统,价格也比较昂贵.虽然通过扫描数据库日志文件可以捕获变化数据,但大多数数据库系统都不提供日志文件的内部格式而只是提供日志访问的程序接口,如Oracle,SQL Server和DB2等.这些提供的接口有的访问活动日志,有的访问稳定日志,有的访问归档日志,因此很难保证读取日志文件的可靠性.现有的研究主要是如何利用程序应用接口读取日志文件,忽略了对可靠性的分析.本文针对读取不同类型的日志文件的可靠性条件进行了分析,提出了可靠读取规则及读取算法;并提出了从日志文件中有效抽取变化数据算法,实验证明了可靠性分析模型. 邹先霞 贾维嘉 潘久辉关键词:数据库日志 可靠性 一种改进的二维曲线的strip树表示及其基本算法 1996年 本文给出了一种改进的二维曲线的strip树表示,并在此基础上,给出了二值图象中曲线的基本算法。 郑永果 潘久辉关键词:遍历 共享多版本源视图的多实化视图异步增量维护 2013年 为了解决补偿和多版本在多实化视图维护上性能不理想的问题,提出了共享多版本源视图的多实化视图异步增量维护方案SMVM(源多版本视图维护).在SMVM中,集成端的实化视图直接定义在多个数据源的共享引用多版本源视图上,并且在收到源视图的数据更新后,向其他相关数据源发送基于版本的维护查询,以此来进行多实化视图的异步增量维护.这样在完全避免数据源并发更新导致增量查询异常的同时,提高了多个实化视图异步增量维护的整体性能,且基于元组标志的视图增量补偿方法使得对源视图的维护更有效.实验结果验证了SMVM的可行性和有效性. 张晓刚 杨路明 潘久辉关键词:异步 多版本 共享 数据仓库自维护下视图分解系统的设计与实现 被引量:1 2007年 数据仓库自维护实质上是通过维护实化视图实现,然而现有的实化视图自维护策略不能有效的减少数据仓库集成端和数据源监视端的多余数据,从而影响数据仓库环境的整体响应速度。一种基于数据仓库自维护方法的视图分解系统改进了现有的视图分解模式,将全局定义的实化视图分解成局部定义的单源视图集来减少存在数据仓库中不必要的数据,实现了现有实化视图自维护策略的分解和重写,提高数据仓库自维护效率。 毛莉 潘久辉关键词:数据仓库 实化视图 可扩展标识语言 一种云关系数据库的浮点数据的加密及查询方法 本发明公开的一种云关系数据库的浮点数据的加密及查询方法,包含以下步骤:一是将浮点数据的密文插入到云数据库:二是通过对存贮在云数据库的浮点数不解密的情况下进行SUM求和,先在云数据库上直接对加密后的属性值按正数和负数分类求... 邹先霞 潘久辉 杜威 朱泰鹏基于多实化视图增量维护的基库生成算法 2006年 数据仓库的维护是数据仓库应用中的一个十分重要的问题,近几年产生了很多的维护算法。已有的维护算法多是针对单个实化视图的维护;或只针对简单SPJ视图的维护;或只针对聚集函数的维护;而实际的数据仓库大多是由包含聚集函数的多个实化视图组成。因此综合考虑包含聚集函数的多个实化视图的维护问题是必然的。文章正是在此情况下提出了一种基于多实化视图增量维护的基库生成算法,在《基于基库的多实化视图增量维护算法》中提出了包含聚集函数的多实化视图的维护算法。 杜威 潘久辉 邹先霞关键词:实化视图 多实化视图的自维护算法 被引量:1 2006年 实化视图的维护是数据仓库技术的重要问题,近几年产生了很多的维护算法。已有的维护算法大多是针对单个实化视图的维护。该文提出了一种多实化视图的自维护算法,该算法利用局部约简规则和主外键引用关系生成较小的辅助视图集,使多实化视图和辅助视图集都是自维护的。 杜威 潘久辉 邹先霞关键词:实化视图