内蒙古自治区自然科学基金(2012MS0912)
- 作品数:9 被引量:51H指数:3
- 相关作者:王静宇谭跃生郑雪峰张亚楠郝晓飞更多>>
- 相关机构:内蒙古科技大学北京科技大学更多>>
- 发文基金:内蒙古自治区自然科学基金国家自然科学基金教育部“春晖计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种面向云计算环境的属性访问控制模型被引量:10
- 2015年
- 针对云计算环境下的访问控制问题,结合云计算环境存在多个逻辑安全域的特点,提出一种面向云计算环境的属性访问控制模型。该模型采用基于属性的访问控制方法实现本地域和跨域访问决策。对该模型进行形式化描述并给出决策核心算法。在域间属性同步方面,设计一种信号量及P/V操作机制以解决对属性表调用和更新的互斥问题。仿真实验表明:该模型不仅实现细粒度访问控制,而且能够缩短访问控制决策时间,提高决策效率。
- 王静宇冯黎晓郑雪峰
- 关键词:云计算访问控制云安全
- 基于Hadoop平台的TFIDF算法并行化研究被引量:2
- 2014年
- 针对大数据集下文本分类算法在单机上训练和测试过程效率低下的问题,提出了基于Hadoop分布式平台的TFIDF文本分类算法,并给出了算法实现的具体流程。通过MapReduce编程模型实现了考虑到词在文档中位置的并行化TFIDF文本分类算法,并与传统串行算法进行了对比,同时在单机和集群模式下进行了实验。实验表明,使用并行化的TFIDF文本分类算法可实现对海量数据的高速有效分类,并使算法性能得到优化。
- 王静宇赵伟燕
- 关键词:MAPREDUCE并行化TFIDF算法
- Hadoop平台上Apriori算法并行化研究与实现被引量:27
- 2013年
- 分析传统串行关联规则Apriori算法的计算过程以及存在的一些缺点,针对串行算法执行效率低,时间复杂度高以及传统并行计算模式不能处理节点失效,难以处理负载均衡等问题,提出基于Hadoop平台实现并行关联规则算法的设计方法,对传统关联规则Apriori算法进行了改进,并给出改进算法在Hadoop平台的MapReduce编程模型上的执行流程;在Hadoop平台上对改进后的算法进行单机测试和集群测试,实验结果证明,改进后的算法具有较高的执行效率,良好的加速比和可移植性。
- 郝晓飞谭跃生王静宇
- 关键词:HADOOP关联规则算法并行计算APRIORI
- MooseFS中chunkserver负载均衡算法研究被引量:2
- 2013年
- 作为云存储的核心基础平台,分布式文件系统的重要性日益凸显。分布式文件系统中数据存储在多台计算机节点上,必然会出现负载均衡问题。首先,对MooseFS的系统架构进行了研究,然后分析了MooseFS分布式文件系统中chunkserver选择算法,研究了chunkserver算法的负载均衡性能,最后对其进行了改进。经过实验测试对比,实验结果显示改进算法能显著提高chunkserver的负载均衡性能。
- 艾云霄谭跃生王静宇
- 关键词:分布式文件系统数据存储负载均衡
- 云计算下基于拜占庭算法的容忍入侵技术研究被引量:2
- 2012年
- 云计算是推动大规模、按需、动态计算发展的新兴技术.然而,云计算平台数据的容忍入侵性能仍有待提高.为了改进云计算平台的容忍入侵性能,研究基于拜占庭算法的容忍入侵技术,以Hadoop为平台实现了MinBFT和MinZyzzyva最小拜占庭算法原型.在对两种算法性能进行比较的基础上,改进了容忍入侵算法性能,实现了在2F+1个副本中容忍F个副本的错误;尽量减少内部通信资源开销和副本数量,降低云计算资源消耗,提高系统容忍入侵性能.
- 王静宇王秀苹张晓琳
- 关键词:云计算容忍入侵
- 基于Hadoop的小文件量化方法研究
- 2014年
- 针对目前Hadoop平台不能高效处理海量小文件而出现的小文件问题,提出一种基于曲线拟合最小二乘法的确定Hadoop平台下何为小文件的方法。该方法首先确定小文件访问时间的量化方法,然后采用访问时间作为确立何为小文件的影响因子,通过对不同数据集大小的不同访问时间的实验,最终结合线性拟合的相关知识找到了小文件大小的量化方法。
- 谭跃生赵玉龙王静宇
- 关键词:HADOOP
- 基于MapReduce的并行遮盖文本聚类算法
- 2013年
- 通过研究Hadoop平台和MapReduce编程框架,提出了一个基于MapReduce的并行遮盖文本聚类算法.遮盖算法提出了两个距离阈值T1,T2用来构建重叠子集,避免了传统聚类算法对噪声敏感的缺点.同时采用适当的快速近似距离度量,大大加快了聚类速度.实验表明该算法在MapReduce框架下有良好的集群加速性能,适合处理大规模的数据集.
- 张亚楠谭跃生
- 关键词:文本聚类HADOOPMAPREDUCE
- Hadoop云平台下的聚类算法研究被引量:6
- 2014年
- 为了解决在面对海量数据时机器学习算法很难在有效时间内完成规定的任务,并且很难有效地处理高维度、海量数据等问题,提出了基于Hadoop分布式平台的谱聚类算法并行化研究。利用MapReduce编程模式,将传统的谱聚类算法进行重新编写;在该平台上用Canopy算法对数据进行预处理,以达到更好的聚类效果。实验结果表明了设计的分布式聚类算法在加速比等方面有良好的性能,并且在数据伸缩率方面效果明显,改进后的算法适合处理海量数据。
- 谭跃生杨宝光王静宇张亚楠
- 关键词:海量数据聚类算法谱聚类
- 一种无可信第三方的密文策略属性加密方案被引量:2
- 2015年
- 针对现有云环境中密文策略属性加密都依赖于一个可信密钥生成机构的问题,提出一种无可信第三方的密文策略属性加密方案.该方案使密钥生成机构在负责用户认证和属性管理时,必须与另一方(如云服务提供商)通过安全双方计算协议来生成密钥,而它们中的任何一方都没有能力单独解密密文.安全性分析表明,所提出的方案能够解决单独密钥生成机构所带来的安全性问题,而且用户端仅需一次加法运算,提高了计算效率.
- 王静宇涂春岩谭跃生郑雪峰
- 关键词:可信第三方访问控制