广东省科技计划工业攻关项目(2010B010600026)
- 作品数:6 被引量:20H指数:3
- 相关作者:刘波潘久辉耿寅融聂玲张晓刚更多>>
- 相关机构:暨南大学中南大学更多>>
- 发文基金:广东省科技计划工业攻关项目广东省教育部产学研结合项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 共享多版本源视图的多实化视图异步增量维护
- 2013年
- 为了解决补偿和多版本在多实化视图维护上性能不理想的问题,提出了共享多版本源视图的多实化视图异步增量维护方案SMVM(源多版本视图维护).在SMVM中,集成端的实化视图直接定义在多个数据源的共享引用多版本源视图上,并且在收到源视图的数据更新后,向其他相关数据源发送基于版本的维护查询,以此来进行多实化视图的异步增量维护.这样在完全避免数据源并发更新导致增量查询异常的同时,提高了多个实化视图异步增量维护的整体性能,且基于元组标志的视图增量补偿方法使得对源视图的维护更有效.实验结果验证了SMVM的可行性和有效性.
- 张晓刚杨路明潘久辉
- 关键词:异步多版本共享
- 多关系实体链计算与近似连接查询的研究
- 2010年
- 针对多个实体集关系,提出了链接属性及实体链有关概念,研究发现了具有相同或相似链接属性的实体链计算方法。多关系之间的实体链计算是近似连接查询的关键,该研究通过分析链接属性相似度,解决多关系之间数据冲突问题,设计了2-实体链和k-实体链计算算法,并运用扩展的SQL查询语言实现实体链计算的主要过程。实体链能够应用于多关系高效查询及动态查询,而且可以获得较高的查询准确率。
- 刘波
- 关键词:相似度查询
- 依赖ER模型的多关系频繁模式发现方法被引量:1
- 2012年
- 为了解决多关系频繁模式挖掘面临的统计偏斜问题和效率问题,提出了基于ER(实体-联系)概念模型的方法。其以ER模型的联系集为核心,利用扩展的关系数据库SQL统计原语,在用户给定数据约束和兴趣度约束的情况下,减少多关系频繁模式的产生数量,既不需要将相关关系表做物理连接,也不会产生统计偏斜。与相关研究工作的比较,说明了利用关系数据库管理系统和ER模型实现多关系频繁模式挖掘的有效性及正确性。
- 刘波
- 关键词:数据挖掘ER模型频繁项集
- 基于条件函数依赖的数据库一致性检测研究被引量:9
- 2012年
- 条件函数依赖是函数依赖在语义上的扩充,可以应用于数据清洗工作,在数据库一致性的修复上应用广泛。讨论了条件函数依赖的相关语义规则,重点研究了基于条件函数依赖对违反数据库一致性元组的检测工作,并引入置信度评价机制,对相关的检测规则进行了改进。改进后的检测方法在基于多个函数依赖的检测中显示出了优越性,使得检测工作更为精简,检测标准更加明确。
- 耿寅融刘波
- 关键词:条件函数依赖函数依赖
- 数据集成中XML Schema到关系模式的转换方法被引量:3
- 2010年
- 根据XML Schema中组件的定义及组件之间的嵌套关系,建立一系列从XML Schema转换成关系模式的结构映射规则和语义映射规则。基于这些规则实现一种转换算法,从Schema中提取出关系模式,并且证明映射得到的关系模式满足4NF。结果表明得到的关系模式不仅包含了XML Schema中所有的结构和内容信息,还能保留大部分语义约束信息,减少存储冗余。
- 聂玲刘波
- 关键词:XMLSCHEMA映射规则语义约束
- 采用属性相关分析的异常数据检测方法被引量:7
- 2011年
- 为了发现数据库中的异常数据,提出了两个数据项集之间相关可信度的新概念,并研究了基于该度量的异常数据检测规则的计算算法,产生的规则适合于离散型属性孤立点的检测。在计算检测规则中,最小相关可信度阈值不需由用户指定,而是根据1-数据项集的频率确定;利用相关可信度的性质,可以减小检测规则计算算法的时间复杂度。实验结果表明,采用该方法计算获得的相关规则进行异常数据检测,不仅效率较高,而且检测的准确率、查全率也较高。
- 刘波潘久辉
- 关键词:异常数据