您的位置: 专家智库 > >

王鹏

作品数:35 被引量:95H指数:5
供职机构:复旦大学计算机科学技术学院更多>>
发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术自然科学总论文化科学更多>>

文献类型

  • 26篇期刊文章
  • 9篇会议论文

领域

  • 34篇自动化与计算...
  • 1篇文化科学
  • 1篇自然科学总论

主题

  • 9篇数据流
  • 8篇数据挖掘
  • 8篇查询
  • 5篇聚类
  • 5篇计数
  • 4篇时间序列
  • 4篇频繁项
  • 2篇语义
  • 2篇事件流
  • 2篇数据划分
  • 2篇索引
  • 2篇贪心
  • 2篇贪心策略
  • 2篇子序列
  • 2篇网络
  • 2篇轮转
  • 2篇聚集查询
  • 2篇决策树
  • 2篇计数算法
  • 2篇概率数据流

机构

  • 35篇复旦大学
  • 1篇南京邮电学院
  • 1篇中原工学院
  • 1篇公安部第三研...

作者

  • 35篇王鹏
  • 24篇汪卫
  • 4篇刘马金
  • 3篇朱传琪
  • 3篇施伯乐
  • 3篇臧斌宇
  • 3篇黄鹏
  • 2篇周皓峰
  • 2篇汪洋
  • 2篇祝然威
  • 1篇邱枫
  • 1篇王欣孃
  • 1篇吴晓晨
  • 1篇王晨
  • 1篇沈建莉
  • 1篇张世永
  • 1篇潘惠勇
  • 1篇王秋棠
  • 1篇顾国飞
  • 1篇马国凯

传媒

  • 9篇计算机工程
  • 9篇计算机应用与...
  • 3篇计算机研究与...
  • 3篇计算机学报
  • 1篇微电子学与计...
  • 1篇计算机科学与...
  • 1篇2007全国...
  • 1篇第27届中国...
  • 1篇第二十五届中...
  • 1篇第二十五届中...

年份

  • 2篇2024
  • 1篇2023
  • 2篇2022
  • 1篇2021
  • 3篇2020
  • 2篇2019
  • 1篇2018
  • 2篇2017
  • 1篇2016
  • 2篇2015
  • 1篇2013
  • 1篇2012
  • 3篇2011
  • 4篇2010
  • 3篇2008
  • 1篇2007
  • 3篇2004
  • 1篇2003
  • 1篇2002
35 条 记 录,以下是 1-10
排序方式:
基于六层安全体系的校园网整体安全解决方案被引量:21
2002年
校园网安全问题日益受到严重关注,单一的方案无法满足目前的安全需求。该文提出了一个包括物理安全、链路安全、网络级安全、信息安全、应用安全和用户安全的六层网络安全体系,并在此之上给出了一个整体安全解决方案,它的特点是多层次、全方位、分布式,覆盖了从底层到高层,从静态被动防御到动态主动防御,从入侵事前、事中到事后,从系统到桌面,从主机到网络的多方位防护,能够给予网络极高的安全性。该文的安全方案也可以推广到其它类型的局域网。
顾国飞沈建莉王鹏沈建莉
关键词:校园网安全
基于数据仓库的典型图查询处理技术被引量:2
2023年
向量化查询等技术的成熟为基于数据仓库(数仓)实现图查询提供了契机,但现有系统没有考虑列式存储特点和图查询语句的特点,无法高效存储图数据及支持图查询优化。同时,由于需要保持原有图查询应用的兼容性,图查询Gremlin语言翻译生成的数仓SQL语言书写复杂且性能较差。针对上述问题,提出基于数仓的图数据库系统PandaGraph。在存储方面,PandaGraph基于关系模型高效存储图数据,结合数仓列式存储的特性进行主键和属性键设计,同时考虑到图查询和数仓查询执行特点,构建出入两张边表供图查询进行选择。在查询方面,PandaGraph结合不同Gremlin步骤的特点,构建关于遍历和存储表的查询结构,实现从Gremlin语言到SQL语言的翻译转化,使用多种优化规则对生成SQL语句进行改写,提高图查询性能。实验结果表明,PandaGraph在多场景下可正确进行翻译查询工作,并且在经典的低k跳查询场景下较现有专有图数据库系统获得5.8倍性能提升,在高k跳场景下可获得18.5倍性能提升,在基于规则的优化、基于表选择的优化和基于表结构的优化下PandaGraph可获得最少1.3、1.1和1.3倍的性能提升。
郭家鼎王鹏
关键词:数据库系统关系型数据库数据仓库查询翻译
基于Storm的实时大规模传感器监控平台的开发和实现被引量:6
2019年
随着云计算的发展,实时流数据处理应用程序得到了越来越广泛的应用。在物联网的场景中,大量传 感器对实时查询要求很高。然而传感器监控分析师对编码技术缺乏经验,而且现有处理平台也缺乏对多查询处 理支持和原始数据先验信息的利用。为了应对这些挑战,开发实现一种轻量级的高效解决方案,以支持在大量传 感器上滑动窗口上的聚合计算。专业分析师可以利用自定义脚本构建自己的流式计算逻辑,系统将其转化为 Storm的流处理程序,并且利用提出的分区算法在分布式实时环境中高效执行多个查询。实验结果表明:该系统 可以有效提高分析师的工作效率,提出的分区算法也有效平衡工作节点之间的负载以满足大规模的应用。
周煜敏王鹏汪卫
关键词:云计算物联网大数据
OSBNC:一种快速贝叶斯网络分类算法
1引言分类技术是一种数据挖掘方法,它被人们公认为数据挖掘领域中的一个重要问题。分类技术可以用于抽取描述重要数据类的模型,人们已对它进行了广泛深入的研究。分类问题中最基本的两种方
王鹏刘震潘瑾程尊平汪卫施伯乐
文献传递
利用U模变换增加并行粒度与改善数据访问局部性的方法被引量:4
2004年
提出了一种利用循环变换增加循环并行粒度 ,改善循环数据访问局部性的方法 .该方法利用了给定二重循环的相关向量集的某些性质 ,将外层循环变量不同而内层循环变量相等的若干次迭代合并 ,成为折叠后迭代空间的一个结点 ,并且保持内层循环的并行性不变 ,从而达到增加循环并行粒度的目的 .对于更普遍的情况 ,该文讨论了如何根据给定循环的循环向量集 ,确定一个U模变换对迭代空间进行变换 ,达到内层循环可并行和扩大循环粒度两个目的 .针对循环变换中数据访问局部性可能变差的问题 ,该文提出了对内层循环先合并 ,根据合并后的相关向量集变换迭代空间 ,以及折叠迭代空间的方法 .该文的方法是wavefront循环并行化方法的一种扩展 .
马国凯王欣孃王鹏臧斌宇朱传琪
关键词:并行化编译
在弱标记的传感器时间序列上基于突变的事件分类
2017年
随着传感器广泛应用于各个领域,在传感器生成的时间序列上识别事件越来越受到广泛的关注。针对震荡的传感器时间序列,提出事件分类算法BEC。对于原始长时间序列和标记时间点作为类标签,BEC主要解决了两个问题。首先是将标记时间点扩展为包含充分信息的子序列以分类,再者是提取基于突变的特征以训练分类模型。实验结果证明,无需大部分时间序列分类问题中不现实的假设和太多人力干预,BEC提取的基于突变的特征能够充分描述事件,极大保留事件中关键信息,在现实数据集上的表现优于现有的时间序列分类算法。
汪雅雯王鹏汪卫
关键词:时间序列传感器数据
基于计数的数据流频繁项挖掘算法
挖掘数据流的频繁项已受到广泛关注,经典的频繁项挖掘算法尽管能够比较好地找到频繁项,但对频繁项频数的估计往往存在较大误差。SRoEC,SReEC和RFreq算法针对该问题,继承基于计数的算法思想,将计数器进行划分并定义相应...
祝然威王鹏刘马金
关键词:数据挖掘
一种轮转的数据流频繁项挖掘算法
挖掘数据流的频繁项已受到广泛关注,研究者们提出了一些高效的数据流上挖掘频繁项的算法,尽管这些算法能够比较好地找到频繁项,但对频繁项支持度的估计往往存在较大误差。而新的算法REC除了能够保证频率超过一定阈值的数据项都能被找...
刘马金王鹏汪卫
关键词:数据流频繁项
文献传递
隐马尔可夫模型路网匹配的MapReduce实现被引量:3
2018年
离线路网匹配考虑全局数据以求更高匹配准确性,因为地图的分割放弃对路网连通性这一严重影响匹配准确性的特性的考量,已有的一些研究尝试使用分布式计算框架来实现。另一方面,以往的研究局限于较小的地图空间,缺乏针对路网匹配应用下大规模地图数据的有效管理。首先提出分布式隐马尔可夫路网匹配模型。该模型利用维特比算法的可分割性,将隐马尔可夫模型这个准确性很高的路网匹配算法运行在分布式计算框架上,在不丢失匹配准确性的前提下,实现了在将路网匹配根据地理位置分而治之的同时减少地图I/O操作,提升计算效率达到50%。
陆健王鹏
关键词:MAPREDUCE隐马尔可夫模型
DSI:一种基于动态分段的时间序列查询索引被引量:4
2020年
时间序列数据主要依据采集时间进行排序,时间序列上相邻的数据具有一定的关联性,当用户读取时间序列数据时不只是读取一条数据,而是连续读取一段时间序列数据。针对时间序列的局部性特点,提出一种基于动态分段的时间序列索引DSI,通过设置差值及差值等级对时间序列数据进行动态分段,使用区间树快速查找不同长度的数据分段块,并利用层次聚类算法优化查询结果集合。实验结果表明,DSI索引的查询效率优于现有时间序列查询索引。
周骑骏王鹏汪卫
关键词:索引范围查询时间序列层次聚类
共4页<1234>
聚类工具0