郭迎春
- 作品数:2 被引量:2H指数:1
- 供职机构:南开大学计算机与控制工程学院更多>>
- 发文基金:国家科技支撑计划天津市科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于STAR码的HDFS失效数据恢复研究
- 2014年
- 针对数据失效、丢失等存储问题,提出了基于STAR码对HDFS中的丢失数据进行恢复,在文件读取过程中,通过对读取失败的数据块所在组的其他可用数据块采用分片、解码和聚合操作,对本组读取失败的数据块进行恢复.给出了基于STAR码与分片聚合编码的数据存储方案,采用了分片聚合解码的数据恢复策略对数据进行恢复,实现了分片聚合解码的数据块动态恢复和数据块持久性恢复.
- 邵秀丽金晶郭迎春许杨
- 关键词:数据恢复解码数据冗余
- Deep Web数据抽取的分析与研究被引量:2
- 2012年
- 从各web站点抽取数据是Deep Web数据集成研究中的重要内容.重点分析数据抽取策略,使用HttpClient工具获取Deep Web页面及其各个分页,并提出了基于样式的定位方法处理被查询页面.最后,为验证提出的数据抽取方案的可行性,实现了一个Deep Web实际应用系统,运行效果表明方案有效可行,较好地解决了数据抽取准确性的问题.
- 郭迎春刘一伟陈召旭
- 关键词:DEEPWEB数据抽取样式