国家自然科学基金(61300026) 作品数:15 被引量:47 H指数:5 相关作者: 吴英杰 孙岚 王一蕾 张立群 卢清 更多>> 相关机构: 福州大学 国防科学技术大学 厦门大学 更多>> 发文基金: 国家自然科学基金 福建省自然科学基金 福建省教育厅科技项目 更多>> 相关领域: 自动化与计算机技术 更多>>
异方差加噪下差分隐私流数据发布一致性优化算法 被引量:1 2019年 现有基于树结构的差分隐私流数据统计发布方法未能充分利用统计查询可能存在的特定分布规律而进一步提升发布流数据的精度,为此,该文提出滑动窗口下基于异方差加噪的差分隐私流数据发布算法。首先动态构建滑动窗口内流数据对应的差分隐私区间树;其次根据统计查询分布规律计算树节点的覆盖概率,据此对树节点的隐私预算及树结构参数进行调整,以实现异方差加噪;最后,针对异方差加噪后区间树节点值可能不满足一致性约束的问题,设计实时的一致性调节策略。实验结果表明:与同类算法相比,该算法具有较高的查询精度及算法效率。 孙岚 康健 吴英杰 张立群置信规则库规则约简的粗糙集方法 被引量:9 2014年 针对置信规则中规则数的"组合爆炸"问题,目前的解决方法主要是基于特征提取的规则约简方法,有效性依赖于专家知识.鉴于此,提出基于粗糙集理论的无需依赖规则库以外知识的客观方法,按照等价类划分思想逐条分析置信规则,进而消除冗余的候选值.最后,以装甲装备能力评估作为实例进行分析,分别从规则约简数、决策准确性方面与具有代表性的主观方法进行对比,结果表明,所提出方法是有效可行的,且优于现有规则约简主观方法. 王应明 杨隆浩 常雷雷 傅仰耿关键词:粗糙集 规则约简 面向多敏感属性保护的p-覆盖k-匿名算法 被引量:1 2013年 隐私保护数据发布是近年来数据挖掘研究中的一个热点.匿名是隐私保护数据发布的一种常用技术.针对当前大部分匿名方法只考虑单敏感属性保护的不足,提出一个p-覆盖k-匿名模型,用于具有逻辑依赖关系的多敏感属性保护,并基于该模型设计出一个支持多敏感属性保护的匿名算法kpCover.仿真实验表明,基于p-覆盖k-匿名模型的算法kpCover能有效解决多敏感属性的删除泄露问题,同时保证发布数据具有较高的数据质量.算法是有效可行的. 王一蕾 吴英杰 孙岚 阮小温关键词:隐私保护 数据发布 基于kd-树的差分隐私二维空间数据划分发布方法 被引量:5 2015年 为解决现有基于网格结构的差分隐私二维空间数据划分发布方法可能引起局部划分过细导致查询精度低的问题,提出了基于kd-树的差分隐私二维空间数据划分发布方法—kd-PPDP算法(differentially privacy partitioning publication algorithm based on kd-tree)。算法采用了kd-树算法思想,通过启发式地识别网格化后数据分布情况并合并相邻近似网格单元来防止局部划分过细问题,从而减少所添加的噪声,提高查询精度。通过实验对比分析了kd-PPDP算法与现有基于网格结构的划分发布方法的查询误差以及时间效率,结果表明了该算法的有效性和可行性。 黄泗勇 陈婷婷 卢清 吴英杰 叶少珍关键词:隐私保护 差分隐私二维数据流统计发布 被引量:8 2015年 目前关于差分隐私数据流统计发布的研究仅考虑一维数据流,其方法无法直接用于解决二维数据流统计发布中可能存在的隐私泄露问题。针对此问题,首先提出面向固定长度二维数据流的差分隐私统计发布算法——PTDSS算法。该算法通过单次线性扫描数据流,以较低空间消耗计算出满足一定条件的二维数据流元组的统计频度,并经过敏感度分析添加适量的噪声使其满足差分隐私要求;接着在PTDSS算法的基础上,利用滑动窗口机制,设计出面向任意长度二维数据流的差分隐私连续统计发布算法——PTDSS-SW。理论分析与实验结果表明,所提算法可安全地实现二维数据流统计发布的隐私保护,同时统计发布结果的相对误差在10%~95%。 林富鹏 吴英杰 王一蕾 孙岚关键词:数据流 隐私保护 个性化隐私保护轨迹发布算法 被引量:4 2014年 传统关于轨迹隐私保护的研究大多假设所有轨迹具有相同的隐私需求。然而,现实应用中不同轨迹的隐私需求可能不尽相同,使用相同的隐私保护标准对轨迹进行处理将使所发布轨迹的可用性降低。为此,提出一种可实现个性化轨迹隐私保护的(K,ε)-隐私模型和基于该模型的个性化隐私保护轨迹匿名算法IDU-K。算法在保证发布轨迹数据的信息损失率不超过阈值ε的前提下,采用基于贪心聚类的等价类划分思想对含有不同隐私需求的轨迹集合进行个性化匿名处理。实验对算法IDU-K的隐私保护有效性及发布数据可用性与同类算法进行比较分析。实验结果表明,算法IDU-K是有效可行的。 孙岚 郭旭东 王一蕾 吴英杰关键词:隐私保护 个性化 面向任意区间树结构的差分隐私直方图发布算法 被引量:4 2015年 当前一种有效的差分隐私直方图发布是先将直方图映射成满m叉区间树,后利用查询一致性约束提高查询精度.然而,并非所有直方图都能映射成满m叉区间树.针对此问题,文中首先提出可实现任意直方图向树结构映射的k-区间树;然后从理论上分析对于任意区间树结构下的差分隐私直方图发布,仍可在一致性约束下利用最优线性无偏估计进一步降低区间计数查询的误差;最后提出面向任意区间树结构基于局部最优线性无偏估计的差分隐私直方图发布算法(LBLUE).实验对比分析同类算法和LBLUE所发布数据的区间计数查询精度及算法效率,表明LBLUE有效可行. 吴英杰 陈鸿 王一蕾 孙岚基于信息熵和局部相关性的多标签传播重叠社区发现算法 被引量:5 2016年 基于标签传播思想的重叠社区发现算法,利用标签的传播特性可有效挖掘潜在的重叠社区结构,但是挖掘过程中采用的随机策略造成传播过程中的不确定性,最终导致结果的不稳定性,因此本文提出一种基于信息熵和局部相关性的多标签传播重叠社区发现算法.该算法在标签传播阶段,采用异步更新策略,利用信息熵产生更新序列指导标签更新,解决社区划分结果不稳定的问题.同时在标签选择阶段,根据节点与自我网络中其他节点的相关程度选择标签,提高所发现社区的质量.基于多个真实数据集和人工网络图的对比实验,结果表明,本文算法有效可行. 张昌理 王一蕾 吴英杰 苏斌勇 王晓东关键词:信息熵 位置服务中连续查询隐私保护的动态规划算法 被引量:1 2013年 针对基于位置服务中连续查询可能存在的隐私泄露问题,提出基于历史轨迹的连续查询隐私保护匿名算法.首先针对传统基于贪心策略的两条轨迹匿名算法无法保证全局最小轨迹扭曲度的不足,设计出可保证全局最优的两条轨迹匿名动态规划算法,找出历史轨迹与连续查询所对应的基轨迹之间的最优配对方案;然后在此基础上提出可有效保护连续查询隐私的轨迹匿名算法.对本文算法与同类算法在发布轨迹数据质量上进行实验比较分析,仿真实验结果表明本文算法是有效可行的. 王一蕾 周浩 吴英杰 孙岚关键词:隐私保护 连续查询 动态规划 差分隐私流数据实时发布中的自适应参数优化 被引量:1 2019年 当前许多实际应用需要持续地对流数据的区间统计查询做出实时响应,并使用差分隐私保护模型来应对信息发布过程中的敏感数据泄露问题。现有研究采用树状数组作为组织和存储流数据的数据结构,以满足信息发布的实时性要求。然而,现有方法中的相关参数为预先确定的,并不能很好地适应查询的动态变化。为此,文中提出在流数据实时发布的框架上,引入历史查询信息,以实现发布过程中树高参数的动态调整。首先,使用移动平均法分析历史查询记录,并预测后续的查询范围分布;继而针对预测结果,通过理论推导,得出使得期望误差最小的树高;最终实现差分隐私流数据实时发布中树高参数的自适应优化。实验结果表明,该方法在保证了时间效率的同时,有效地提高了发布结果的精度。 吴英杰 黄鑫 葛晨 孙岚关键词:历史查询