广西研究生教育创新计划项目(YCSZ2012007)
- 作品数:4 被引量:26H指数:2
- 相关作者:钟诚吕婉琪陈志朕唐印浒韦火旺更多>>
- 相关机构:广西大学更多>>
- 发文基金:广西研究生教育创新计划项目广西壮族自治区自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Hadoop分布式架构下大数据集的并行挖掘被引量:21
- 2014年
- 基于Hadoop分布式计算平台,给出一种适用于大数据集的并行挖掘算法。该算法对非结构化的原始大数据集以及中间结果文件进行垂直划分以确保能够获得完整的频繁项集,将各个垂直分块数据分配给不同的Hadoop计算节点进行处理,以减少各个计算节点的存储数据,进而减少各个计算节点执行交集操作的次数,提高并行挖掘效率。实验结果表明,给出的并行挖掘算法解决了大数据集挖掘过程中产生的大量数据通信、中间数据以及执行大量交集操作的问题,算法高效、可扩展。
- 吕婉琪钟诚唐印浒陈志朕
- 关键词:数据挖掘大数据集HADOOP
- 基于并行聚类的物联网k-匿名算法被引量:2
- 2013年
- 给出物联网可容忍空间粒度和可容忍时间粒度两个参数,建立适用于物联网环境的k-匿名模型。提出数据集分布序列的概念,以优化生成聚类种子,对数据进行并行聚类,使等价类含有多个节点的数据,具有布局特性的数据被划分到不同的等价类中,从而模糊数据的具体位置信息,消除标签的布局特性,设计适用于物联网环境的隐私保护k-匿名算法。实验结果表明,该算法在确保物联网数据可用的前提下,能够有效保护数据中的隐私信息,提高数据的安全性。
- 韦火旺钟诚
- 关键词:物联网K-匿名隐私保护并行聚类
- 隐私保护的多数据源高投票率序列模式挖掘被引量:1
- 2015年
- 在多数据源环境中,通过计算数据库项集相似度,按照一定分类原则,设计了数据库数目和类个数可变的多数据源序列模式分类算法;在给出一种有效的多数据源高投票率序列模式挖掘方法的基础上,结合隐私保护要求,采取"分类—清洗—合成—挖掘"方法,提出一种隐藏敏感模式的多源高投票率序列模式挖掘算法。与不隐藏敏感模式的多源高投票率序列模式挖掘算法进行实验测试对比,结果表明:本文提出的算法只需花费额外少量的敏感模式匹配处理时间,可确保算法能够在挖掘得到全局高投票率序列模式的同时,隐藏敏感模式、保护多源数据中的隐私信息.
- 张莹钟诚
- 关键词:多源数据序列模式挖掘隐私保护
- 支持词形词义模糊检索的可搜索加密算法被引量:2
- 2017年
- 采用倒排索引结构建立安全索引文件,以支持文件动态更新,利用WordNet接口对关键词词义拓展,构造词形模糊集与词义模糊集,给出一种满足用户在云计算环境中对密文数据进行词形和词义模糊检索需求的可搜索加密算法DSFS。分析表明DSFS算法是CKA2安全的,真实数据集的测试结果表明,与已有可搜索加密算法相比,DSFS算法获得较全面的检索结果、检索速度更快。
- 赵晨阳钟诚
- 关键词:云计算安全