中央高校基本科研业务费专项资金(2011121049) 作品数:8 被引量:49 H指数:4 相关作者: 林子雨 邹权 赖永炫 林琛 薛永生 更多>> 相关机构: 厦门大学 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家自然科学基金 福建省自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
一种新的时间序列延迟相关性分析算法——三点预测探查法 被引量:10 2012年 延迟相关性分析是时间序列数据挖掘的重要研究内容,它可以在很多领域得到应用,比如股票市场分析、天气预报、网络分析、移动对象跟踪和传感器监控等;通过实验发现和验证了时间序列延迟相关性分析中存在的3个现象,即连续分布性、延迟突变和突变幅度分布特性;证明了已有研究或者在延迟位置较大时具有较大的误差,或者无法解决延迟突变问题;根据3个实验现象,提出了三点预测探查法(three points forecast-based probing,TPFP),它可以克服已有算法的缺陷,在延迟位置较大时也可以具有较小的误差,并且可以有效处理大部分延迟突变情形.大量实验证明,三点预测探查法可以比已有方法取得更好的性能. 林子雨 江弋 赖永炫 林琛关键词:时间序列 基于替换概率的闪存数据库缓冲区替换算法 被引量:12 2013年 闪存具有和传统磁盘不同的特性,包括写前擦除、异地更新、读写延迟非对称等.传统的面向磁盘的缓冲区替换算法无法在闪存数据库系统中获得较好的性能.文中提出了一种新的面向闪存数据库的缓冲区替换算法——APB-LRU,其特点:(1)该算法将缓冲区分为冷区和热区,用来捕获数据访问频度,前者用于存放只访问过一次的数据页,后者用于存放至少访问过两次的数据页;(2)采用了其它研究所没有的概率替换机制,即以较大的概率替换冷区中的干净页,以较小的概率替换冷区中的脏页,从而避免了冷脏页长期驻留缓冲区的情况,提高了命中率,获得了较好的整体性能;(3)设计了冷、热区比例动态变化机制,可以根据工作负载的变化动态调整冷、热区所占缓冲区的比例,从而使得替换算法在不同的负载模式下都可以取得较好的性能.基于不同测试数据集的大量实验结果表明,APB-LRU算法具有比其它已有的算法更好的性能. 林子雨 赖明星 邹权 薛永生 杨思颖关键词:闪存 数据库 基于关系数据库的top-k聚合关键词查询 被引量:3 2014年 基于关系数据库的关键词查询,使得用户在不需要掌握结构化查询语言和数据库模式的情况下,可以方便地进行关系数据库查询.给定一个关键词查询,已有的方法通过数据库中的主外键关联,查询得到包含关键词的元组集合.但是,在很多实际应用中,元组集合的聚合结果对用户更有价值;研究了基于关系数据库的top-k聚合关键词查询,提出了基于递归的聚合单元枚举算法——基于递归的完全搜索(recursion-based full search,RFS).为了获得更好的查询性能,设计了新的排序方法、二维索引和快速搜索算法——基于输出的快速搜索(output-based quick search,OQS),从而可以高效地枚举top-k个聚合单元;在不同的数据集上进行了大量的实验,实验结果表明OQS算法具有良好的查询性能. 张东站 苏志锋 林子雨 薛永生关键词:关系数据库 排序 CF-HNLBI:一种新的闪存数据库B-树索引 被引量:1 2015年 提出了一种新的基于B-树的闪存数据库索引——CF-HNLBI索引.使用链表组织缓冲区中的更新信息,减少了缓冲区遍历时间,通过链表结构减少冗余信息,提高了缓冲区利用率.将缓冲区分为冷区和热区,并采用基于更新信息频度的替换算法,有效地减少了闪存写操作次数.实验结果表明,CF-HNLBI索引比其他已有索引具有更好的性能. 刘颖杰 林子雨 赖永炫关键词:闪存 数据库 索引 B-树 XML动态区间编码方法 被引量:5 2012年 提出了适用于XML文档更新环境下的区间编码方法——DCLS(dynamic containment labeling scheme).DCLS将基于整数的编码泛化到基于向量的编码,扩展了传统静态区间编码方法,有效避免了XML文档更新时的重新编码.不论文档更新与否,DCLS都显示了良好的性能:DCLS利用基于整数的静态区间编码方法进行初始编码,在文档不更新的环境下,具有较高的存储效率和查询性能;同时,DCLS将整数视为特殊向量,不仅能够支持文档更新,而且更新效率高;特别是倾斜插入时,DCLS可以避免编码位长的快速增加.实验结果表明,与已有的动态区间编码方法相比,DCLS具有更好的性能. 庄灿伟 冯少荣 林子雨 张东站关键词:可扩展标记语言 编码技术 下一代测序技术数据中的选择性剪切计算识别方法研究 2012年 随着测序技术的发展,下一代测序技术(Nex-t Generation Sequencing)给生物信息学领域研究带来了新的机遇和挑战.由于选择性剪切(alternative splicing,AS)在真核生物基因表达和蛋白质多样性方面的重要性,识别选择性剪切位点一直都是研究的重点.下一代测序技术的出现,使得选择性剪切研究的计算方法不断地变化.介绍了选择性剪切过去和目前研究的状况,然后总结了基于RNA-seq数据的选择性剪切研究方法、软件以及数据库,并利用了RNA-seq数据比较了相关软件,最后讨论了选择性剪切中计算方法的发展方向和前景. 邹权 李旭斌 林子雨 江弋 林琛关键词:RNA-SEQ 选择性剪切 剪切位点 生物信息学 关系数据库中的关键词查询结果动态优化 被引量:18 2014年 关键词查询可以帮助用户从数据库中快速获取感兴趣的内容,它不需要用户掌握专业的数据库结构化查询语言,降低了使用门槛.针对基于关键词的数据库查询,基于数据图的方法是一种比较常见的方法,它把数据库转换成数据图,然后从数据图中计算最小Steiner树.但是,已有的方法无法根据不断变化的用户查询兴趣而动态优化查询结果.提出采用蚁群优化算法解决数据库中的关键词查询问题,并提出了基于概念漂移理论的用户查询兴趣突变探查方法,可以及时发现用户兴趣的突变.在此基础上,提出了基于概念漂移理论和蚁群优化算法的查询结果动态优化算法ACOKS*,可以根据突变的用户兴趣,动态地优化查询结果,使其更加符合用户查询预期.在原型系统上得到的大量实验结果表明,该方法具有很好的可扩展性,并且可以比已有的方法取得更好的性能. 林子雨 邹权 赖永炫 林琛关键词:关键词查询 关系数据库 蚁群优化 STEINER树 基于视图树的实视图动态选择 被引量:1 2012年 为用户缓存实视图可以有效提高其OLAP查询的性能.但是,已有的缓存管理策略由于没有考虑用户在进行OLAP分析时的数据访问特性,在处理实视图动态选择问题时无法获得好的性能.提出了视图路径和视图树的概念,并以视图树作为客户端缓存中的实视图组织方式.提出了"逆路径增长法"来快速计算新到达查询的视图路径,提高了查询的响应速度.对于视图树的动态调整问题,以"保留路径"为参照,设计了合理有效的视图替换策略.实验证明,该方法能够比已有的动态选择方法取得更好的性能. 林子雨 邹权 林琛 赖永炫 郑炜关键词:数据仓库 联机分析处理 多维数据 缓存