您的位置: 专家智库 > >

张雪源

作品数:7 被引量:33H指数:3
供职机构:华南理工大学电子与信息学院更多>>
发文基金:国家自然科学基金广东省自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 1篇学位论文

领域

  • 6篇电子电信
  • 1篇自动化与计算...

主题

  • 5篇音频
  • 3篇信号
  • 3篇信号处理
  • 3篇音频检索
  • 3篇音频特征
  • 3篇音频信号
  • 3篇音频信号处理
  • 3篇音效
  • 2篇倒排索引
  • 2篇索引
  • 1篇多项式
  • 1篇心理声学
  • 1篇音频分割
  • 1篇声纹
  • 1篇说话人识别
  • 1篇内容相似度
  • 1篇频分
  • 1篇子空间
  • 1篇字典
  • 1篇相似度

机构

  • 7篇华南理工大学
  • 2篇茂名职业技术...

作者

  • 7篇张雪源
  • 4篇贺前华
  • 3篇杨继臣
  • 2篇李艳雄
  • 2篇李新超
  • 2篇林静
  • 1篇苏卓生
  • 1篇叶婉玲
  • 1篇罗海宇
  • 1篇朱华虹
  • 1篇林沛
  • 1篇王志锋

传媒

  • 2篇华南理工大学...
  • 1篇电子与信息学...
  • 1篇数据采集与处...
  • 1篇华中科技大学...
  • 1篇计算机应用

年份

  • 2篇2016
  • 2篇2015
  • 1篇2013
  • 1篇2012
  • 1篇2011
7 条 记 录,以下是 1-7
排序方式:
基于感知子空间分解模型的音频特征提取方法
2015年
提出了一种基于谐波-瞬时-残差感知子空间分解模型的音频特征提取方法.首先,根据心理声学的研究成果,提出了基于感知的谐波分子、瞬时原子和残差分布字典,可分别用于提取音频中的长时谐波成分、瞬时频率成分和残差谱分布特性;随后,利用该字典和匹配追踪算法,将音频信号分解到谐波子空间、瞬时子空间和残差子空间这三个感知子空间;最后,通过融合各子空间的特征参数生成音频特征.实验表明:在15类音效分类任务中,所提出的特征比传统梅尔频率倒谱特征准确性提升9.1%,比基于传统匹配追踪的特征提升8.3%.
贺前华张雪源杨继臣林沛
关键词:音频信号处理心理声学
一种基于倒排索引的音频检索方法被引量:8
2012年
传统的基于实例的音频检索算法采用顺序索引,检索时需遍历数据库并导致难以忍受的等待时间。针对传统的顺序的索引方法,该文提出基于倒排索引的音频检索算法。该方法首先利用多种音频特征构成的超向量,通过多层音频分割方法将连续音频流分割为特征数值波动幅度小的短时音频段;然后利用事先训练好的音频字典,将短时音频段序列转换为可以表征音频内容的音频字序列,并建立倒排索引;检索时,将用户提交的查询转换为音频字后利用倒排索引无须遍历数据库即可直接定位候选段落,并根据候选段落与查询的内容相似度大小对候选段落进行排序,将排好序的列表作为检索结果。仿真实验以匹配项排名、同类检索结果比例、定位准确性和检索用时4个方面作为评价指标,实验结果显示,该算法能够在平均1.101 s时间内实现92.58%的检索准确率。
张雪源贺前华李艳雄叶婉玲
关键词:音频信号处理音频检索内容相似度倒排索引
基于随机映射的声纹模板保护方法被引量:1
2013年
针对生物特征模板涉及用户隐私而易受到各种攻击的问题,在定义随机映射形式化表示的基础上,结合主流文本无关说话人识别技术,提出了一种基于随机映射的声纹模板保护方法.在注册阶段,将声纹特征映射至随机空间再训练高斯混合模型(GMM),并存储模型参数作为模板;在认证阶段,待认证的声纹特征在相同的变换域与模型库进行匹配.文中还给出了该方法在认证性能保持和安全性方面的理论分析.实验结果表明,适当降维能在提高安全性的同时近似保持GMM的身份认证性能,而目前基于矢量量化的认证性能下降超过8%,说明随机映射更适用于基于GMM的声纹认证系统的模板保护.
朱华虹贺前华李艳雄张雪源
关键词:声纹高斯混合模型
基于信道模式噪声的录音回放攻击检测被引量:15
2011年
近来出现的高质量低价格的录音及回放设备的高保真度使人耳也难以分辨出原始语音和回放语音,这使得录音回放攻击对说话人识别系统的安全造成了很大威胁.为此,文中提出了一种基于信道模式噪声的录音回放攻击检测方法.该方法根据原始语音与回放语音信道的差异,针对不同信道中的录音及回放设备引入不同的信道模式噪声,采用去噪滤波器和统计帧分析的方法提取信道模式噪声,在信道模式噪声的基础上提取了6阶Legendre系数及6个统计特征,并利用支持向量机训练信道噪声模型判决输入是否为回放攻击.实验结果表明,加载录音回放检测模块后,说话人识别系统对含有回放攻击数据的等错误率下降了约30%.
王志锋贺前华张雪源罗海宇苏卓生
关键词:说话人识别LEGENDRE多项式
基于稀疏表示权重张量的音频特征提取算法被引量:5
2016年
为了更好地描述非平稳音频信号的特征,提出了一种基于Gabor字典和稀疏表示权重张量的时-频音频特征提取方法。该方法基于Gabor字典将音频信号编码为稀疏的权重向量,并进一步将权重向量中的元素重新排列为张量形式,该张量各阶分别刻画了信号的时间、频率以及时长特性,为信号的联合时-频-长表示。通过对该张量进行因子分解,将分解后得到的频率因子和时长因子拼接为音频特征。针对稀疏张量分解时容易产生过拟合的问题,提出一种自调整惩罚参数分解算法并进行了改进。实验结果显示,所提出的特征相对于传统梅尔倒谱系数(MFCC)特征、MFCC特征及匹配追踪算法(MP)求解的特征联合拼接得到的MFCC+MP特征和非均匀尺度-频率图特征对15类音效分类效果分别提升了28.0%、19.8%和6.7%。
林静杨继臣张雪源李新超
一种基于指纹因子的鲁棒音频检索方法被引量:3
2016年
针对基于内容的音频检索中由于噪声造成的查找失败问题,本文提出了一种对噪声鲁棒的基于音频指纹因子的音频特征提取算法和一种半监督的音频字典训练算法,以提高噪声下音频检索的精度。本文方法从Mel谱中提取音频指纹,利用非负矩阵分解算法将指纹分解为对噪声鲁棒的频率因子和时间因子作为特征。同时通过提出的半监督音频字典训练算法进行音频字典训练,本文方法使用音效集计算基本音效的分布空间作为初始字典,在量化数据的同时动态更新字典以实现对数据的准确描述。实验结果表明,在低信噪比条件下本文提出的算法的平均查询精度明显高于其他算法。
林静杨继臣张雪源李新超
关键词:音频检索非负矩阵分解倒排索引
面向音频检索的音频特征分析方法研究
随着互联网技术的发展和手持录像、录音设备的普及,普通用户可以获取的多媒体数据呈现爆炸式增长。为了实现对海量多媒体数据的管理和检索,基于内容的检索技术成为了研究热点。这种检索方法要求用户直接给出反映查询意图的样例,系统从中...
张雪源
关键词:音频信号处理音频特征音频分割
共1页<1>
聚类工具0