您的位置: 专家智库 > >

国家自然科学基金(61202477)

作品数:7 被引量:67H指数:4
相关作者:刘燕兵郭莉张宇于静谭建龙更多>>
相关机构:中国科学院中国科学院大学北京邮电大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 7篇中文期刊文章

领域

  • 6篇自动化与计算...
  • 1篇电子电信

主题

  • 3篇多模式
  • 3篇多模式串匹配
  • 3篇索引
  • 3篇模式串
  • 3篇串匹配
  • 2篇多模式串匹配...
  • 2篇数据管理
  • 2篇数据压缩
  • 2篇全文索引
  • 2篇串匹配算法
  • 1篇递归
  • 1篇信息安全
  • 1篇优化技术
  • 1篇入侵
  • 1篇入侵检测
  • 1篇散列
  • 1篇散列函数
  • 1篇社交
  • 1篇社交网
  • 1篇社交网络

机构

  • 7篇中国科学院
  • 3篇北京邮电大学
  • 3篇中国科学院大...
  • 2篇河北师范大学
  • 1篇国防科学技术...
  • 1篇中国人民大学
  • 1篇国家计算机网...
  • 1篇中国移动(深...

作者

  • 7篇刘燕兵
  • 5篇郭莉
  • 3篇于静
  • 3篇张宇
  • 2篇谭建龙
  • 2篇路炜
  • 2篇熊刚
  • 2篇刘庆云
  • 2篇王春露
  • 1篇刘萍
  • 1篇贾焰
  • 1篇邵妍
  • 1篇刘梦雅
  • 1篇张萍
  • 1篇王勇

传媒

  • 2篇通信学报
  • 1篇计算机研究与...
  • 1篇计算机学报
  • 1篇计算机应用与...
  • 1篇软件学报
  • 1篇中国科技论文

年份

  • 3篇2015
  • 4篇2014
7 条 记 录,以下是 1-7
排序方式:
HashTrie:一种空间高效的多模式串匹配算法被引量:7
2015年
经典的多模式串匹配算法AC的内存开销巨大,已经无法满足当前高速网络环境下大规模特征串实时匹配的应用需求。针对这一问题,提出一种空间高效的多模式串匹配算法—Hash Trie。该算法运用递归散列函数,将模式串集合的信息存储在位向量中,以取代状态转移表来减少空间消耗,并利用Rank操作进行快速匹配校验。理论分析表明,Hash Trie算法的空间复杂度为O(|P|),与模式串集合的规模|P|线性相关,与字符集大小σ无关,优于经典多模式串匹配算法AC的空间复杂度O(|P|σlog|P|)。在随机数据集和真实数据集(Snort、Clam AV和URL)上的测试结果表明,Hash Trie算法比AC算法节约高达99.6%的存储空间,匹配速度约为AC算法的一半左右。Hash Trie算法适合于模式串集合规模较大、模式串长度较短的多模式串匹配问题,是一种空间高效的多模式串匹配算法。
张萍刘燕兵于静谭建龙
关键词:入侵检测多模式串匹配位向量
一种面向大规模URL过滤的多模式串匹配算法被引量:13
2014年
对大量有害的URL进行过滤,是目前网络安全应用系统中所亟需的关键技术.使用经典的串匹配算法检测庞大的URL规则集,需要消耗大量的计算资源和存储资源,性能十分低下.该文设计了一种适合于大规模URL过滤的多模式串匹配算法——SOGOPT.该算法在经典的SOG算法基础上,针对URL规则的特点,提出了最优窗口选择、模式串分组规约这两种优化技术,大幅度提高了SOG算法的匹配速度,在大规模URL规则集上效果尤其显著.该文设计的算法非常适合于大规模(100万级)URL实时在线匹配的应用环境.
刘燕兵邵妍王勇刘庆云郭莉
关键词:多模式串匹配URL过滤信息安全
HybridFA:一种基于统计的AC自动机空间优化技术被引量:3
2015年
针对高级Aho-Corasick(AC)自动机为提高串匹配速度而造成的空间浪费问题,研究发现数据流对自动机节点的访问规律,据此提出基于数据访问特征的混合自动机构建算法Hybrid FA。分别研究了基于访问频率、访问层次以及结合上述2种特征对AC自动机的部分节点实现完全化的算法。在Snort、Clam AV、URL等真实数据集上的实验结果表明,Hybrid FA算法的存储空间低于高级AC自动机的5%。此外,结合访问频率和访问层次的改进算法在保证匹配速度的同时具有更强的数据适应性。
熊刚何慧敏于静刘燕兵郭莉
关键词:多模式串匹配
图数据表示与压缩技术综述被引量:12
2014年
对包含亿万个节点和边的图数据进行高效、紧凑的表示和压缩,是大规模图数据分析处理的基础.图数据压缩技术可以有效地降低图数据的存储空间,同时支持在压缩形式的图数据上进行快速访问.通过深入分析该技术的发展现状,将该技术分为基于传统存储结构的压缩技术、网页图压缩技术、社交网络图压缩技术、面向特定查询的图压缩技术4类.分别对每类技术详细分析了其代表方法并比较了它们之间的性能差异.最后对该技术进行了总结和展望.
张宇刘燕兵熊刚贾焰刘萍郭莉
关键词:社交网络
压缩的全文自索引算法研究被引量:2
2014年
针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空间。综述现有的十几种典型的压缩的全文自索引算法的基本思想及其实现,并在多种数据集上对这些算法进行综合的测试评估。实验结果表明,压缩的全文自索引技术有效地节省了空间开销,实用价值较高。
路炜刘燕兵王春露刘庆云郭莉
关键词:全文索引数据压缩后缀数组
大规模图数据匹配技术综述被引量:34
2015年
在大数据时代海量的多源异构数据间存在着紧密的关联性,图作为表示数据之间关系的基本结构在社交网络分析、社会安全分析、生物数据分析等领域有着广泛应用.在大规模图数据上进行高效地查询、匹配是大数据分析处理的基础问题.从应用角度对用于图查询的图数据匹配技术的研究进展进行综述,根据图数据的不同特征以及应用的不同需求对图匹配问题分类进行介绍.同时,将重点介绍精确图匹配,包括无索引的匹配和基于索引的匹配,以及相关的关键技术、主要算法、性能评价等进行了介绍、测试和分析.最后对图匹配技术的应用现状和面临的问题进行了总结,并对该技术的未来发展趋势进行了展望.
于静刘燕兵张宇刘梦雅谭建龙郭莉
关键词:子图同构索引技术图搜索
高性能文本索引系统的设计与实现被引量:1
2014年
针对传统文本索引技术空间消耗大、分词不准确等问题,设计并实现了高性能文本索引系统。该系统采用压缩的全文自索引算法,节省了空间开销,避免了自然语言分词方法的影响,配合通配符搜索算法扩展了模糊搜索的功能,在众核CPU高性能处理器上可实现多线程并行处理,提高了处理速度,整个系统的实现是基于Web方式的,可以跨平台运行。实验结果表明,该系统将文本索引的空间消耗降为原文本的50%左右,具有较高的实用价值。
路炜张宇周美孜刘燕兵王春露
关键词:计算机应用文本索引全文索引
共1页<1>
聚类工具0