您的位置: 专家智库 > >

国家自然科学基金(61272156)

作品数:1 被引量:0H指数:0
相关作者:高军更多>>
相关机构:北京大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇等式
  • 1篇三角不等式
  • 1篇速查
  • 1篇索引
  • 1篇索引方法
  • 1篇快速查询
  • 1篇TOP-K
  • 1篇TOP-K查...
  • 1篇不等式
  • 1篇层次化
  • 1篇查询

机构

  • 1篇北京大学

作者

  • 1篇高军

传媒

  • 1篇计算机研究与...

年份

  • 1篇2015
1 条 记 录,以下是 1-1
排序方式:
面向Top-k快速查询的层次化LSH索引方法
2015年
局部敏感哈希(locality sensitive hashing,LSH)用于在海量高维数据中检索相似的数据项,它能高效地返回相似度大于用户给定阈值的数据对.但是,由于需要设置固定阈值,LSH无法直接处理Top-k相似查询.传统LSH索引算法需要设置一系列阈值,分别建立索引,时间和空间代价较大.提出了一种层次化的LSH索引算法,通过动态构建层次化相似度图,充分利用三角不等式,减少不必要的索引构建代价.具体来讲,首先通过高阈值构建相似度图,将高度相似的数据点抽象成"超点",再在"超点"上构建低阈值的相似度图.查询时,首先查询高阈值相似度图;数量不足时再查询低阈值相似度图.实验表明,相比传统LSH算法,本文方法在构建索引的时间和空间代价上减小一个数量级,查询更加高效.
罗雄才高军
关键词:TOP-K查询三角不等式
共1页<1>
聚类工具0