国家自然科学基金(41301440)
- 作品数:5 被引量:62H指数:3
- 相关作者:尹凌胡金星赵志远汪伟许宁更多>>
- 相关机构:中国科学院中南大学武汉大学更多>>
- 发文基金:国家自然科学基金广东省自然科学基金深圳市基础研究计划项目更多>>
- 相关领域:天文地球自动化与计算机技术社会学经济管理更多>>
- 大规模手机位置数据研究中的个体重识别风险及其与数据可用性的关系
- 2016年
- 手机位置数据是一种新兴的轨迹数据源,在支持人类移动研究方面具有巨大的潜力。近期研究指出,基于手机用户独特的活动特征,许多用户能够被轻易地重识别。然而,隐私保护处理对原始数据的改变会导致数据可用性的损失。因此,使用详细位置数据进行活动分析的同时避免隐私风险成为一个挑战。本研究旨在揭示中国一个大型城市的手机用户重识别风险,以及将该数据用于人群移动分析时,用户重识别风险和数据可用性之间的量化关系。首先,以深圳市为例,评估全市某一主要运营商手机用户的重识别风险;然后,提出并实现一种空间泛化方法以保护用户隐私;最后,使用人群移动分析为例,评估隐私保护后数据可用性的损失。结果显示,深圳市的重识别风险不同于西方城市,证明了基于手机位置数据的重识别风险具有空间异质性。其次,发现了重识别风险(x)和数据可用性(y)之间的数学关系y=-axb+c(a,b,c>0;0
- 尹凌胡金星王倩汪伟蔡芷铃
- 关键词:数据可用性
- 轨迹数据的时间采样间隔对停留识别和出行网络构建的影响被引量:5
- 2018年
- 个体轨迹数据已经广泛用于人群活动的研究中。在静止的局部空间开展的活动是个体日常生活的基本元素,在轨迹数据中对应停留部分。因此学者常从轨迹数据中识别停留来研究个体活动信息。然而,轨迹数据的时间采样间隔会对停留识别带来影响。针对该问题,首先提出了一个框架,量化不同持续时间长度的活动在不同时间采样间隔的轨迹数据中被识别为停留的概率。其次,考虑到个体出行网络依赖于停留识别结果,基于该框架,研究分析了时间采样间隔对出行网络分析结果的影响。最后,利用该框架分别对深圳市居民出行调查数据和手机轨迹数据进行了分析。研究表明,在面向人群活动的研究和应用中,该框架能支持时间采样间隔的选择决策和面向活动类型的研究结果评价。
- 赵志远尹凌方志祥萧世伦杨喜平
- 利用手机通话位置数据估计城市24 h人口分布误差被引量:5
- 2017年
- 手机通话位置数据已经成为全球范围内广泛使用的人类活动研究数据,其为高时空分辨率的人口分布估计提供了一种新的途径。然而,手机通话位置数据具有不规则稀疏采样的特点,其反映出的人口分布可能具有一定误差。本研究以深圳市为例,首次结合24 h连续定位的手机信令数据,分别从时间和地理维度量化分析了使用手机通话位置数据估计24 h人口分布的偏差,同时探讨了剔除低频用户对上述偏差的影响。本研究揭示,在居民活跃时间段,使用通话用户的分布估计人口分布时,相对误差的中位数在25%~30%之间;城市内部的土地利用类型与通话用户人口估计偏差具有显著的关联;剔除低频用户会略微减小土地利用对人口分布偏差的影响。本研究成果可帮助理解手机通话位置数据在估计高时空分辨率人口分布上的局限性和适用性,为合理使用手机通话位置数据进行相关研究和应用提供科学依据。
- 尹凌姜仁荣赵志远宋晓晴李晓明
- 关键词:人口分布土地利用
- 基于频繁活动点集的手机位置数据隐私保护方法被引量:3
- 2017年
- 大规模手机位置数据在为人类活动研究带来新的前景的同时,数据中蕴涵的个体活动点可能导致用户重识别,即隐私信息泄露。针对个体的频繁活动点集合,计算手机位置数据中的个体重识别风险,通过点集匹配策略实现高风险个体敏感位置信息的隐匿;利用交通流分析来评价隐私保护后的数据可用性损失。基于深圳市大规模手机位置数据实验,结果表明提出的方法在降低整体隐私泄露风险和确保隐私保护后的数据可用性方面皆具有良好效果。研究成果对大规模手机位置数据隐私保护具有重要的促进作用,有助于保障此类大规模个体轨迹数据的安全应用以及相关法律法规的合理制定。
- 汪伟尹凌
- 关键词:隐私保护数据挖掘
- 从大规模短期规则采样的手机定位数据中识别居民职住地被引量:49
- 2014年
- 使用大规模手机定位数据获取居民职住地分布是大数据趋势下城市研究的新兴技术。然而,现有的研究主要使用了长期不规则稀疏采样的手机通话数据,对短期规则采样的手机定位数据缺乏尝试。基于大规模短期规则采样的手机定位数据,提出了一种居民职住地识别的方法。这是首次从大规模短期规则采样的手机定位数据中进行居民职住地识别的尝试,并对识别结果进行了较全面的验证。该研究成果为职住平衡等相关城市问题研究探讨了一种新型大规模数据源的可行性,在低成本大幅度提高相关研究的样本代表性和分析结果可靠性上具有重要意义。
- 许宁尹凌胡金星
- 关键词:时空数据挖掘