北京市教育委员会科技发展计划面上项目(KM201310009003)
- 作品数:9 被引量:26H指数:3
- 相关作者:韩燕波杨冬菊王菁张赛王桂玲更多>>
- 相关机构:北方工业大学山东科技大学天津大学更多>>
- 发文基金:北京市教育委员会科技发展计划面上项目北京市教育委员会科技发展计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于历史车牌识别数据的套牌车并行检测方法被引量:11
- 2016年
- 针对现有套牌车检测方法中所具有的成本高及检测效率低等缺点,提出一种基于历史车牌识别数据(ANPR)集的套牌车并行检测方法 TP-Finder,实现了基于整数划分的数据分块策略,能有效求解大规模数据并行处理时的数据倾斜问题,显著提升套牌车辆的发现性能。此外,实现了基于TP-Finder方法的套牌车辆查询系统,可准确呈现所有疑似套牌车辆的历史行车轨迹。最后,在某市真实交通数据集上对TP-Finder方法的性能进行了实验验证。实验结果表明,与缺省的MapReduce分块策略相比较,TP-Finder的分块策略能够带来最大20%的性能提升。
- 李悦刘晨
- 关键词:数据划分MAPREDUCE
- 基于频繁子图挖掘的数据服务Mashup推荐被引量:1
- 2016年
- 该文基于大量用户的数据服务Mashup方案历史记录,通过将其构造成图并进行频繁子图挖掘,形成包含数据服务关联关系的知识库,提出一种能够根据用户选取的数据服务推荐后续数据服务列表的推荐算法。在构建知识库的过程中考虑数据服务后续的一元操作,提出了数据操作单元的概念,方便分析数据服务之间的关联关系,并采用了g Span算法来挖掘数据服务的频繁子集。最后通过Yahoo!Pipes以及模拟数据集验证,该方法能够在用户创建数据服务Mashup的过程中有效快速地推荐数据服务。
- 张仲妹王桂玲张赛韩燕波
- 关键词:数据服务MASHUP推荐系统
- 一种面向海量小文件的文件接收和存储优化方案被引量:5
- 2015年
- HDFS是目前最典型的云存储平台,它凭借其高容错、可伸缩和廉价存储的优点支持大规模数据集的存储.但是HDFS对于海量、高并发、连续、高速的小文件的接收和存储效率并不高.针对这一问题,提出一种优化方案RSMSF.在该方法中,文件缓存服务器不断地接收前端文件,给文件添加标识信息并存放到对应的文件队列.当文件队列满足某一窗口阈值时,根据一致性哈希算法将该队列中的文件发送到对应的文件处理服务器上进行文件合并处理,最后上传到HDFS.实验表明,RSMSF方法减少了文件的处理时间,降低了文件丢失率,同时降低了HDFS中内存的开销,节约了存储空间.
- 张守利杨冬菊韩燕波
- 关键词:HDFS海量阈值
- 面向移动客户端的数据服务推荐策略研究被引量:1
- 2015年
- 将移动设备所具有的随时随地、灵活按需的特点和云平台中的海量数据和服务无缝集成已成为云计算和移动计算共同的研究热点.在移动客户端上进行数据服务的推荐,可以减少用户在狭小的屏幕空间上进行浏览和选取带来的不便.同时,将位置信息作为推荐的依据可以增加推荐的准确性.提出一种面向移动客户端的数据服务推荐策略,综合使用图论模型、协同过滤模型等方法来进行推荐,可以支持移动用户快速准确地找到自己需要的数据服务.通过实例验证表明,该策略可以有效提高用户获取服务的效率,改善用户体验.
- 刘鑫洋王菁韩博洋
- 关键词:移动客户端图论协同过滤
- 一种支持可变输入、输出参数的数据服务
- 2013年
- 传统Web服务提供一组包含固定输入、输出参数的操作,通常无法满足针对数据资源的内容提出的各种查询请求。提出一种支持可变输入、输出参数的数据服务,其操作可以满足基于数据内容的各种查询请求。首先,服务描述中添加数据内容的描述,指明服务能够提供哪些数据;然后,定义了一个支持可变输入、输出参数的操作,其输入是一个包含输入、输出参数及参数约束的查询请求,输出是查询请求中输出参数所对应的数据;最后,给出了关系型数据的服务化方法,并通过实验从功能角度验证了方法的有效性。
- 张峰陈欣魏永山
- 关键词:数据服务
- 基于云存储的二阶段动态优化调度机制被引量:2
- 2014年
- 在分布式存储的研究中,如何高效地利用存储空间是个热点问题。存储集群中,每个数据节点存储容量不可能完全一致,由于主节点选择数据节点的随机性,被选中数据节点磁盘可能接近满额,此时主节点会自动做存储负载均衡,占用数据传输带宽,不仅影响数据传输的性能,而且会引起传输数据的不可靠。论文提出一种基于云存储的二阶段动态优化调度机制:第一阶段通过计算副本存储优选比率,采用基于贪心算法的局部优化存储方案,选择存储节点,均衡副本放置空间;第二阶段采用实时监控存储集群,动态调整副本放置节点,达到存储资源的高效利用。最后通过实验,验证了该调度机制可有效地放置副本,减少节点间的数据传输,并提高文件访问效率。
- 任川杨冬菊
- 关键词:优化调度贪心算法
- 基于数字指纹的智能终端缓存一致性技术的研究被引量:4
- 2017年
- 针对智能终端存在与服务器数据不一致的问题,提出基于数字指纹的数据一致性保障方法.数字指纹又叫hash指纹,采用改进的BKDR哈希算法将消息数据和实体文件数据映射成相应的哈希码.将需要进行一致性处理的数据集按合适的粒度进行划分,并在SOAP消息中附带hash指纹提取协议,智能终端通过Web服务从服务器端获取需要的hash指纹信息文件,然后通过比较智能终端和服务器的hash指纹信息文件消除差异,从而保障智能终端缓存与服务器数据的一致性.
- 张艳飞王菁韩燕波
- 关键词:智能终端数据一致性数字指纹数据缓存WEB服务
- 一种数据流处理环境下的节点副本放置方法被引量:1
- 2014年
- 物联网环境下的许多应用表现为传感数据的连续流式处理,且系统往往通过节点的副本技术保障可用性。但是,运行时副本的备份和放置存在内存和带宽等资源开销,产生处理的延迟。该文给出一种方法,根据运行时的资源消耗以贪心方式放置节点的副本,折中了系统的可用性和开销。实际系统的仿真实验表明,在相同的条件下,该方法相比传统的随机放置,能为系统提供更稳定的可用性。
- 丁维龙韩燕波
- 关键词:物联网数据流副本放置贪心算法
- 一个用户主导的情景数据集成应用构造环境被引量:1
- 2014年
- 随着网络的普及和深入应用,人们希望共享和集成丰富的网络信息资源,以满足其个性化需求。文中提出了一个用户主导的情景数据集成应用构造环境DSS,用以支持大量不具备专业编程知识的最终用户自行利用既有的网络信息资源即时构造应用。DSS支持当前常见的网络信息资源,实现了交互式的网页资源个性化服务封装,并将Spreadsheet和嵌套关系模型相结合,提供了可视化的嵌套电子表格操作和公式语言,以支持用户进行数据服务的组合。通过案例和相关工作的分析比较,表明了DSS上述功能的有效性。
- 王桂玲曹波张赛耿美珍张峰
- 关键词:数据集成数据服务MASHUP