李艳辉
- 作品数:2 被引量:10H指数:2
- 供职机构:东北大学计算机科学与工程学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于差分隐私的频繁序列模式挖掘算法被引量:8
- 2017年
- 针对当数据集含有敏感信息时,直接发布频繁序列模式本身及其支持度计数都有可能泄露用户隐私信息的问题,提出一种满足差分隐私(DP)的频繁序列模式挖掘(DP-FSM)算法。该算法利用向下封闭性质生成候选序列模式集,基于智能截断方法从候选模式中挑选出频繁的序列模式,最后采用几何机制对所选出模式的真实支持度添加噪声进行扰动。另外,为了提高挖掘结果的可用性,设计了一个阈值修正的策略来减小挖掘过程中的截断误差和传播误差。理论分析证明了该算法满足ε-差分隐私。实验结果表明了该算法在拒真率(FNR)和相对支持度误差(RSE)两个指标上明显低于对比算法PFS2,有效地提高了挖掘结果的准确度。
- 李艳辉刘浩袁野王国仁
- 关键词:隐私保护数据挖掘
- PCPIR-V:基于Spark的并行隐私保护近邻查询算法被引量:2
- 2016年
- 针对面向大数据的隐私保护查询效率低问题,利用CPIR保护程度高,实现了基于Spark的并行CPIR空间近邻查询隐私保护算法PCPIR-V,提出了基于Row和Bit的并行策略,同时提出并实现了基于聚类的PCPIR-V的缓存优化技术。利用均匀分布、高斯分布和真实数据对PCPIR-V进行了测试验证,在40个核心范围内,PCPIR-V具有良好的扩展性,PCPIR-V缓存优化技术计算时间与朴素PCPIR-V时间相比,平均减少了20%。
- 邓诗卓姚继涛王波涛陈月梅袁野李艳辉王国仁
- 关键词:SPARK基于位置服务