国家自然科学基金(61322208)
- 作品数:2 被引量:3H指数:1
- 相关作者:王斌杨晓春王佳英王晓晔王培培更多>>
- 相关机构:东北大学中国人民解放军95806部队更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于语句特征的音乐哼唱快速检索技术被引量:1
- 2017年
- 哼唱检索作为音乐检索的重要方式,由于其有效性和方便性,引起了广泛的关注.本文提出了一种新的基于语句特征的音乐哼唱快速检索技术,可以实现哼唱音乐的快速检索.该技术将音乐数据库和用户提供的哼唱片段,按自然停顿方式划分音乐语句,使用BDTW算法对音乐语句片段进行音高相似性计算,并允许用户根据自己哼唱情况,对匹配条件进行个性化设置,限制数据库音乐片段和查询序列的局部最大差异长度.另外,对音乐库建立支持音乐语句查询的索引结构DIS,减少了检索时间.实验结果表明所提出的检索方法能够快速有效地返回查询结果.
- 王培培杨晓春王斌王晓晔
- 关键词:音乐检索哼唱检索子序列匹配DTW算法
- 面向压缩生物基因数据的高效的查询方法被引量:2
- 2016年
- 随着下一代、第三代等测序技术的快速发展,DNA等生物序列数据快速增长.如何高效地处理这些大数据是目前所面临的一个挑战.研究发现,这些生物序列数据尽管很大,但是不同数据之间具有很高的相似性.因此可以通过保存这些基因串同一个基准序列之间的差异来减少存储的代价.最新的研究发现,可以在这些压缩的数据上直接进行查询,而不需要解压缩.研究的目标是进一步提高索引和查询的可伸缩性,从而满足日益增长的大数据需要.首先在现有方法的基础上,对基准序列进行了压缩存储.基于该压缩数据,提出了一系列优化查询方法以高效地支持任意长度序列的精确和近似查询.在此基础上,进一步对原有方法进行改进,利用并行计算来提高对大数据的查询效率.最后,实验研究展示了所提方法的高效性.
- 王佳英王斌杨晓春
- 关键词:基因数据大数据可伸缩性数据压缩并行计算