国家自然科学基金(60873066) 作品数:7 被引量:143 H指数:4 相关作者: 舒继武 肖达 陈康 敖莉 郑纬民 更多>> 相关机构: 清华大学 北京邮电大学 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 更多>>
一种基于重复数据删除的备份系统 被引量:5 2012年 重复数据删除技术有效地提升了备份系统的备份效率,但重复数据的匹配开销也随之增加.针对该问题,设计并实现了一种基于重复数据删除的备份系统THBS,该系统提出了高精简的数据备份方法HAD(hierachical approach of data deduplication),依次从目录、文件、块、字节粒度分层多步,由粗及细地匹配删除重复数据,同时采用bloomfilter和倒排索引技术,以减少不必要的数据匹配与磁盘访问,提高匹配查找速度.通过两组真实数据集的实验发现,THBS在备份过程中节省了63.1%~96.7%的存储空间,比Scp和Rsync分别节约了71.3%~97.6%,41.2%~66.7%的网络带宽,累计备份时间分别为Scp和Rsync的75%~86%和91%~97%. 陆游游 敖莉 舒继武关键词:备份系统 重复数据删除 一种海量数据分级存储系统TH-TS 被引量:20 2011年 随着数据存储规模的飞速增长,降低存储系统的总拥有成本,提高数据访问性能成为构建海量存储系统的关键.设计并实现了一个海量数据分级存储系统TH-TS(Tsinghua Tiered Storage),由多级存储设备构成一体化的数据存储环境.该系统提出了Cute Mig数据迁移方法:采用基于升级成本和升级收益的升级迁移策略和基于剩余空间的文件自适应降级选择策略,解决了传统on-demand迁移方法中迁移数据量大、访问性能不佳的问题.评测结果表明,TH-TS采用Cute Mig迁移方法的系统平均I/O响应时间比传统的LRU和GreedyDualSize方法分别降低了10%和39%左右,数据升级迁移量分别降低了32%和59%左右,降级迁移量分别降低了47%和66%左右. 敖莉 于得水 舒继武 薛巍Corslet安全文件系统的分析和优化 随着网络存储技术的发展,在不可信的网络存储环境下如何保护共享数据不被入侵和窃取等存储安全问题也受到越来越多的重视.阐述了近几年来共享安全文件系统的研究现状,对本研究组提出的安全文件系统Corslet进行了分析,描述了其中... 沈志荣 薛矛 薛巍 舒继武关键词:OPENSSL 文献传递 基于连续多版本的可审计文件系统 被引量:3 2009年 随着越来越多的法律法规要求将电子数据纳入审计监督范围,电子数据安全审计变得愈来愈重要.电子数据审计要求为数据的更改生成可验证的审计跟踪记录.现有的针对电子数据审计的系统因为不能防止内部人员的攻击以保证审计跟踪记录的安全可信,无法很好地满足用户需求.设计并实现了一个基于连续多版本的可审计文件系统CV-AFS,通过连续多版本技术连续捕获和保存文件系统数据变化,引入了一个可信的审计代理负责生成相应的审计跟踪记录,事后审计机构可根据审计跟踪记录来对数据进行审计,从而防止了内部人员的攻击.通过使用增量Hash算法,降低了生成审计跟踪记录的开销.作者在Linux上基于多版本文件系统ext3cow实现了CV-AFS的原型系统并进行了性能测试.Postmark的测试结果表明,CV-AFS的总时间开销要比使用传统完全Hash算法的开销降低43.5%. 黄荣荣 舒继武 陈康 肖达关键词:安全审计 Corslet安全文件系统的分析和优化 被引量:1 2011年 随着网络存储技术的发展,在不可信的网络存储环境下如何保护共享数据不被入侵和窃取等存储安全问题也受到越来越多的重视.阐述了近几年来共享安全文件系统的研究现状,对本研究组提出的安全文件系统Corslet进行了分析,描述了其中的角色并分析了其关键技术.对Corslet安全文件系统进行了性能测试以及优化.通过大文件读写的测试可以得出密码学开销占据了其大部分读写开销的结论.针对此,进一步提出了两方面优化措施,分别是对其密码学算法实现进行改进和使用新的密码学函数库.IOzone的测试实验表明,两方面的优化措施带来的读写性能提高分别是16%—25%和5%—12%. 沈志荣 薛矛 薛巍 舒继武关键词:OPENSSL 一个网络归档存储中实用的数据持有性检查方案 被引量:24 2009年 在网络归档存储中,数据持有性检查(DPC)用来在实际文件访问发生之前实时地检测远端服务器是否仍然完好地持有文件.提出一个实用的DPC方案.在一个挑战-应答协议中,检查者要求服务器计算文件中若干随机指定的数据块的一个Hash值,并和对应的校验块一起返回,以此判断文件的持有性.通过这种随机抽样校验的方法,在保证足够的置信度的同时降低了持有性检查的计算和通信开销.同时提出一个基于校验块循环队列的挑战更新机制,从而允许动态增加检查者可发起的有效挑战的次数.分析表明检查者端的存储开销和检查者和服务器间的通信开销均为常数量级.测试结果表明一次置信度为99.4%的持有性检查的计算开销为1.8ms,和磁盘I/O开销相比可以忽略不计;通过避免使用公钥密码系统,将文件预处理的计算开销降低了3个数量级. 肖达 舒继武 陈康 郑纬民关键词:归档存储 数据完整性 单向HASH函数 Flash存储技术 被引量:90 2010年 Flash存储器具有非易失性、固态性、体积小、重量轻、抗震动、高性能、低能耗等特点.近年来,随着容量的提高和价格的降低,Flash存储器在通用计算环境中的应用技术迅速成为研究热点.研究的目的是对Flash存储技术研究现状进行分析、总结,以期为进一步的研究工作提供启发.首先介绍了Flash的存储特性,探讨了其在存储体系结构中地位,并讨论了管理Flash存储器的两种软件体系结构.然后重点分析、总结了Flash存储的各项关键技术的研究现状,包括地址映射机制、垃圾回收机制、磨损均衡策略、基于Flash的buffercache管理策略、基于Flash的索引数据结构以及基于Flash的事务处理技术.最后对Flash存储技术的研究现状进行总结,提出可能的未来研究方向. 郑文静 李明强 舒继武关键词:闪存 存储管理 闪存转换层 缓存 事务处理 垃圾回收 Redbud并行文件系统的可扩展存储管理机制 2015年 数据规模和并发访问的需求日益增长,可扩展能力成为并行文件系统的重要需求之一.文中提出了一种基于非对称并行文件系统Redbud的高可扩展资源管理机制.该管理机制根据数据的访问特征,使用不同的树形结构管理不同类型的数据,满足了文件数据和元数据的并发检索需求;该管理机制还使用文件级的数据分布机制,允许用户利用各种策略进行目录和文件的管理,能满足文件级的数据访问性能、目录级数据可靠性等实际应用需求.多个基准测试程序和实际应用程序的测试结果表明,文件的独占访问能达到磁盘95%的性能;同时,随着设备和应用节点的增加,数据和元数据的并发访问性能线性增长. 易乐天 舒继武 郑纬民关键词:存储资源管理 共享磁盘