国家自然科学基金(61303017) 作品数:13 被引量:21 H指数:2 相关作者: 潘晓 吴雷 吴雷 郭景峰 王腾 更多>> 相关机构: 石家庄铁道大学 燕山大学 河北经贸大学 更多>> 发文基金: 国家自然科学基金 河北省自然科学基金 国家级大学生创新创业训练计划 更多>> 相关领域: 自动化与计算机技术 经济管理 社会学 天文地球 更多>>
大数据背景下签到轨迹数据质量评价与实证 2019年 随着定位技术的蓬勃发展,位置相关数据量呈指数式增长,其中数据劣质的问题日益显著。数据质量是统计工作的核心。轨迹大数据在各行各业应用渗透性不断扩大,确保轨迹大数据的可靠性、准确性和及时性,才能做出合理的决策,大数据的机遇和优势才能充分得到发挥。基于此,文章构建了大数据背景下签到轨迹数据质量的影响因素指标模型,利用真实的签到数据集,分析了影响签到轨迹数据质量的影响因素,并提出了提高签到轨迹数据质量的对策和方法。 潘晓 马昂关键词:数据质量 大数据 支持OR语义的高效受限Top-k空间关键字查询技术 被引量:3 2020年 近些年,随着定位系统和移动设备的普及,空间文本对象的数量日益庞大,基于位置的地理信息服务在人们的生活中发挥着越来越重要的作用.对于空间关键字查询搜索的研究亦如火如荼.然而,现有许多研究工作只适用于AND语义,支持OR语义的搜索研究相对较少.当用户放松对关键字匹配的要求时,支持OR语义的搜索技术显得尤为重要.针对这一问题,在聚集线性四分树的基础上,利用线性四分树上物理存储的Morton码与逻辑空间位置的对应性,提出了基于虚拟网格的VGrid算法.该算法可同时支持OR语义和AND语义.最后,通过在真实数据集上进行大量实验,验证了所提算法的有效性和高效性. 潘晓 于启迪 马昂 孙亚欣 吴雷 吴雷关键词:移动计算 基于密度聚类的签到轨迹大数据分层预处理研究 被引量:4 2019年 随着基于位置的社交网络的发展,时空-文本等轨迹数据量呈指数式增长,与此同时数据低质的问题日益显著。高质的签到数据可以使研究人员更好地从中挖掘丰富且有意义的知识,因此为了更有效地使用签到大数据,数据预处理必不可少。签到数据具有冗余度高、同时签到、时空签到跨度大等低质问题,导致不能直接使用现有的数据预处理流程和方法。针对签到数据特性,提出一套具有针对性的数据预处理流程。通过平均化处理消除了签到轨迹中存在的同时签到数据;通过学习基于熵的时间戳间隔阈值划分签到轨迹,解决签到轨迹时间跨度大的问题;利用基于密度聚类的方法实现签到轨迹分层,解决空间跨度大的问题。实验采用真实的签到轨迹数据,从离群点和分层效果两个方法对预处理效果进行评价,实现不同空间粒度的签到轨迹分离预处理,为后续的轨迹分析与挖掘奠定基础。 文若晴 马昂 潘晓 杨伟伟关键词:预处理 聚类 基于矩阵分解的个性化轨迹推荐方法 被引量:1 2021年 轨迹推荐在轨迹数据挖掘中尤为重要,可以帮助用户从大量轨迹数据中快速找到满足用户需求的路线。现有的轨迹推荐方法通常是在原始轨迹数据上考虑特定代价标准最优的前提下返回出行路线,无法体现不同用户的不同行为习惯。针对此问题,将用户前后连贯的活动刻画为行为,提出基于矩阵分解的用户行为概率学习方法。基于学习的用户行为概率,将寻找概率最大路线问题转换为在行为图中寻找最短路径的问题。在真实数据集进行一系列实验,验证了算法的有效性和可行性。 潘晓 马昂 闫晓倩 吴雷一种基于语义轨迹的相似性连接查询算法 被引量:2 2020年 随着移动互联网的快速发展和智能移动设备的广泛普及,携带文本信息的轨迹数据量大量增加,随之而来的轨迹相似性查询研究也在如火如荼地开展。空间轨迹相似性研究是查询轨迹集合中相似轨迹的主要方法,即缩减轨迹数量。由于许多的轨迹都是携带大量文本信息的,而空间轨迹相似性研究考虑的是距离方面,缺少对于文本信息的考虑。针对这一问题,在空间相似性的基础上增加对于文本相似性的考虑,同时将整个空间网格化,通过采用计算空间文本相似性上下限进行范围查询,得到最终的结果,使得轨迹相似性查询更全面,也更具有说服力。 高祎晴 潘晓 吴雷关键词:范围查询 道路网络上基于网络Voronoi图的隐私保护算法 被引量:2 2015年 基于位置服务(location-based services,LBSs)中的不可信服务提供商不断收集用户个人数据,为用户隐私带来威胁.因此,LBSs中的位置隐私保护研究已在学术界和工业界受到广泛关注.现有道路网络中的位置隐私保护方法大多是基于深度或广度图遍历的算法,需重复扫描道路网络的全局拓扑信息,匿名效率较低.针对这一问题,利用网络Voronoi图(network Voronoi diagram,NVD)将道路网络事先划分为独立的网络Voronoi单元,将传统方法中的多次遍历全局道路网络转化为了访问网络Voronoi单元中的局部路网信息.根据网络Voronoi单元覆盖的移动用户数和路段数,将网络Voronoi单元分为了不安全单元、安全-中单元和安全-大单元3类,提出了适应不同类型网络Voronoi单元特点的高效位置匿名算法.最后,通过在真实数据集上进行大量实验,验证了提出算法在仅比传统算法多牺牲0.01%的查询代价的前提下,保证了100%的匿名成功率和0.34ms的高效匿名时间,在隐私保护强度和算法性能方面取得了较好的平衡. 潘晓 吴雷 胡朝君关键词:位置隐私 道路网络 基于位置服务 移动计算 一种路网环境中的轨迹隐私保护技术 被引量:2 2017年 不经过隐私处理直接发布轨迹数据会导致移动对象的个人隐私泄露,传统的轨迹隐私保护技术用聚类的方法产生轨迹k-匿名集,只适用在自由空间环境,并不适用于道路网络环境中。针对上述问题设计了一种路网环境中的轨迹隐私保护方法,将路网环境中的轨迹模拟到无向图上,并将轨迹k-匿名问题归结到无向图的knode划分问题上。证明了图的k-node划分是NP-完全问题,并提出贪心算法解决此问题。通过实验验证了该算法的匿名成功率平均接近60%,最高可达80%以上。 霍峥 王腾关键词:路网 隐私保护 数据发布 The time model for event processing in internet of things 被引量:1 2019年 The time management model for event processing in internet of things has a special and important requirement. Many events in real world applications are long-lasting events which have different time granularity with order or out-of-order. The temporal relationships among those events are often complex. An important issue of complex event processing is to extract patterns from event streams to support decision making in real-time. However, current time management model does not consider the unified solution about time granularity, time interval, time disorder, and the difference between workday calendar systems in different organizations. In this work, we analyze the preliminaries of temporal semantics of events. A tree-plan model of out-of-order durable events is proposed. A hybrid solution is correspondingly introduced. A case study is illustrated to explain the time constraints and the time optimization. Extensive experi? mental studies demonstrate the efficiency of our approach. Chunjie ZHOU Xiaoling WANG Zhiwang ZHANG Zhenxing ZHANG Haiping QU关键词:TIME EVENT THINGS TIME INTERVAL TIME DISORDER 世界经济系统动态演化SAR模型与仿真研究 2014年 文章将现代对称理论、复杂网络理论分析方法,特别是关于动态系统分析的方法引入到世界经济体系分析中,以阐明世界经济结构演化的本质、过程及其机理。 李占平 王辉 潘晓关键词:经济体系 基于轨迹大数据的司机出行知识图谱构建与实现 被引量:1 2023年 蕴含静态路网特性和动态交通特性的轨迹大数据具有多源异构的特点,给交通知识分析和挖掘带来了困难。近年兴起的知识图谱可对多源异构数据进行有效融合、对齐和加工。基于轨迹大数据,采用自底向上的方法在结构化数据中构建司机出行知识图谱,还原轨迹数据的时空关系和语义关联。具体来说,通过RDF Mapping进行知识抽取,将结构化数据映射为RDF数据;再利用Neo4j存储对静态路网拓扑进行知识补齐和融合。司机出行知识图谱的构建为交通出行知识查询和推理奠定了良好基础;同时,从结构化数据中自底而上构建知识图谱的方法可被扩展应用于其他领域的结构化数据,对推广知识图谱应用起到推进作用。 李璇 吴雷 吴雷 潘晓关键词:知识图谱