您的位置: 专家智库 > >

张勇

作品数:8 被引量:44H指数:4
供职机构:东南大学计算机科学与工程学院更多>>
发文基金:国家自然科学基金江苏省自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 8篇自动化与计算...

主题

  • 5篇隐私
  • 4篇隐私保护
  • 4篇聚类
  • 2篇平移
  • 2篇聚类分析
  • 2篇本体
  • 1篇遗传算法
  • 1篇隐私保护模型
  • 1篇语义
  • 1篇容忍
  • 1篇数据发布
  • 1篇数据隐藏
  • 1篇数值型
  • 1篇数值型数据
  • 1篇亲密
  • 1篇子集
  • 1篇向量
  • 1篇描述逻辑
  • 1篇计算方法
  • 1篇保护数据

机构

  • 8篇东南大学
  • 1篇南昌工程学院

作者

  • 8篇张勇
  • 6篇倪巍伟
  • 4篇崇志宏
  • 3篇贺玉芝
  • 2篇漆桂林
  • 2篇付雪峰
  • 2篇胡新平
  • 2篇刘腾腾
  • 1篇黄茂峰

传媒

  • 4篇计算机研究与...
  • 2篇东南大学学报...
  • 1篇电子学报
  • 1篇软件学报

年份

  • 2篇2016
  • 3篇2012
  • 1篇2011
  • 2篇2010
8 条 记 录,以下是 1-8
排序方式:
一种向量等价置换隐私保护数据干扰方法被引量:6
2012年
近年来,隐私保护数据发布得到了研究者的广泛关注,聚类与隐藏原理上的差异使得面向聚类的隐藏成为难点.针对现有保距和保分布隐藏难以有效兼顾数据聚类可用性和隐私安全的不足,提出基于保邻域隐藏的扰动算法VecREP(vector equivalent replacing based perturbing method),通过分析数据点邻域组成结构,引入能够保持数据邻域组成稳定的安全邻域定义.进一步基于向量偏移与合成思想,提出有效保持邻域数据分布特征的等价置换弧.对任意数据点,采用随机选取位于其安全邻域内等价置换弧上点替换的策略实现隐藏.将算法与已有的RBT,TDR,Camp-crest和NeNDS算法进行实验比较,结果表明:VecREP算法具有与保距隐藏算法RBT相近的聚类可用性,优于其余算法,能够较好地维持数据聚类的可用性.同时,具有好于其余算法的数据隐私保护安全性.
倪巍伟张勇黄茂峰崇志宏贺玉芝
关键词:聚类
基于赌轮选择遗传算法的数据隐藏发布方法被引量:13
2012年
面向聚类挖掘的隐私保护微数据发布是数据挖掘研究的新兴热点之一,其目标是通过对微数据数值的修改实现对微数据隐私的保护,同时保证隐藏后数据具有与原数据集相同(或相似)的聚类效果.从保持数据邻域关系稳定的角度,提出一种基于赌轮遗传的干扰方法RWSGA,采用在数据点的k邻域内运用赌轮算子随机选择2个数据点进行交叉或变异的思想实现数据隐藏.进一步,提出从高密度点区域筛选k邻域中心以改进变异操作选择域的优化策略,解决变异操作可能导致数据扰动幅度过大的问题.理论分析和实验结果表明,该方法能较好地对原始数据进行扰动修改以保护数据隐私不泄露,同时保证发布前后的数据聚类结果差异较小.
胡新平贺玉芝倪巍伟张勇
关键词:隐私保护聚类遗传算法
基于密度可达的聚类隐私保护模型
2012年
针对面向聚类的数据隐私发布问题,基于密度可达邻域的概念,提出一种面向聚类的隐私保护模型PPC(r,ε,h).该模型通过要求隐藏后所有数据记录在ε内密度可达(r相关)的近邻数不小于h,以避免可能出现的近邻攻击.进一步提出密度可达安全邻域概念,对不满足模型要求的邻域,采用平移近邻的数据隐藏方法进行处理,保证发布后数据集满足模型约束.并利用邻域价值和邻域相似性的概念,对平移过程进行优化.理论分析和实验结果表明,基于PPC(r,ε,h)隐私模型设计的数据隐藏方法,能有效维持原数据集中数据点在各聚簇中的分布,且兼顾了发布后数据的聚类可用性和数据安全性.
贺玉芝倪巍伟张勇
关键词:隐私保护模型聚类分析
多维数值敏感属性隐私保护数据发布方法被引量:6
2010年
为避免多维数值敏感属性数据发布中的近似猜测攻击,基于分解思想提出了一种有效的数据发布方法(l-MNSA).首先通过按敏感属性值均匀间隔分组的方法,提出针对单维数值敏感属性的l-SNSA算法;然后提出最小距离的思想,通过将敏感属性统一化并按最小距离均匀间隔分组,提出适用于多维数值敏感属性的l-MNSA算法.与以往仅针对单敏感属性的发布算法相比,该算法同时能对多维敏感属性提供较好的保护.实验结果表明,采用l-MNSA算法发布的数据,其组内最小差异与l-SNSA算法针对各维属性分别发布的结果相比,平均降低10%左右,算法时间复杂度仍为O(nlgn).该算法可以较好地均衡发布数据的安全性和可用性,是有效可行的.
刘腾腾倪巍伟崇志宏张勇
关键词:隐私保护数值型数据数据发布
一种面向聚类的隐私保护数据发布方法被引量:15
2010年
隐私保护微数据发布技术可以在保护敏感数据隐私的同时,维持数据的可用性.但已有的多数发布方法都局限于类别属性数据集,发布后数据可用性以维持数据聚集查询可用性和频繁项集分析、分类挖掘可用性为主.针对数据挖掘领域另一重要任务——聚类分析,以及聚类分析中常处理的数值属性数据隐藏发布问题,提出隐藏算法NeSDO,算法对数据记录关于聚类可用性的特征进行分析,引入个性数据记录和共性数据记录的定义.采用合成数据替换扰动方法,为个性数据记录定义相应的正邻域记录集和负邻域记录集.对共性数据记录用其k最近邻域数据记录的均值替换;对个性数据记录分别采用其正邻域记录集或负邻域记录集内记录的均值进行置换,实现隐藏处理.理论分析和实验结果表明,算法NeSDO能够较好地保护敏感数值不泄露,同时能够有效保持发布后数据的聚类可用性.
崇志宏倪巍伟刘腾腾张勇
关键词:聚类
一种基于图的DL-Lite本体最小不可满足保持子集的计算方法被引量:2
2016年
演变中的本体常出现不一致性问题,这将导致标准推理失效.针对不一致性问题,最小不可满足保持子集能够提供本体中概念不可满足的解释.计算最小不可满足保持子集是本体工程中的一项重要的非标准推理任务,但多数计算方法须借助外部的推理机,导致计算的效率不高.为了减少对推理机的依赖,本文提出了一种基于图的最小不可满足保持子集的计算方法.新的方法面向DL-Lite描述逻辑家族,将DL-Lite本体转换成图,将本体中的最小不可满足保持子集转换成图上的最小不可满足保持路径对.对比实验表明,基于图的方法提高了计算的效率和稳定性.
付雪峰漆桂林张勇
关键词:本体描述逻辑
基于图的不一致容忍语义下的查询应答方法被引量:1
2016年
本体在演变的过程中常出现不一致性问题,这将导致经典的推理模式失效.不一致容忍语义能有效地解决推理失效的问题,但各类不一致容忍语义或者需要耗费大量计算,或者丢弃了本体中有效的信息.为此,一种针对IAR-语义和ICAR-语义的变种被用以解决上述的缺陷.新定义的IPAR-语义能够避免计算整个ABox关于TBox的封闭,在减少计算量的同时尽可能地保留了本体中的信息.在IPAR-语义下实现了基于图的查询应答方法,新方法将本体和查询以不同的规则构建成图,避免了传统重写导致的查询冗余的问题.最后,通过实验对比新的查询应答方法与ICAR-语义下的查询应答方法,实验结果表明:基于图的一致性查询方法执行效率要优于ICAR-语义下的查询方法;在本体规模不断增加的情况下,新方法具有更好的稳定性.
付雪峰漆桂林张勇
关键词:本体
基于邻域相关性的面向聚类数据扰动方法被引量:1
2011年
针对面向聚类应用的隐私保护数据发布问题,引入邻域相关性概念,提出了一种基于邻域相关性的数据扰动算法NCDP,分析每个数据点邻域中与其邻域亲密的所有点以及邻域的平衡性,在不平衡情况下除去亲密集中可能的局部噪声数据点,向每个邻域亲密点进行一定长度的平移,得到扰动后的数据点.理论分析表明,扰动后的数据点不仅实现了对原始数值的保护,而且扰动前后数据点的邻域亲密点仍然维持亲密关系,从而保持了邻域的稳定性.实验采用k-means和DBSCAN聚类算法对扰动前后的数据进行聚类,并且与其他扰动算法进行了分析对比.实验结果表明,算法NCDP扰动前后的数据聚类结果有较高的相似度,可以较好地兼顾保护数据隐私与维持聚类可用性.
张勇倪巍伟崇志宏胡新平
关键词:聚类分析
共1页<1>
聚类工具0