您的位置: 专家智库 > >

贵阳市科学技术计划项目([2011101]1-2)

作品数:6 被引量:8H指数:2
相关作者:潘平罗辉何朝霞王洋田庚更多>>
相关机构:贵州大学长江大学哈尔滨工业大学更多>>
发文基金:贵阳市科学技术计划项目贵州省科学技术基金贵州省国际科技合作计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 3篇电子电信
  • 3篇自动化与计算...

主题

  • 3篇特征提取
  • 2篇信号
  • 2篇识别方法
  • 2篇说话人
  • 2篇说话人识别
  • 2篇说话人识别方...
  • 2篇子模
  • 2篇量子
  • 2篇篡改
  • 2篇篡改检测
  • 1篇带通
  • 1篇带通滤波
  • 1篇带通滤波器
  • 1篇音频
  • 1篇音频信号
  • 1篇语音
  • 1篇语音信号
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇神经网

机构

  • 6篇贵州大学
  • 3篇长江大学
  • 2篇哈尔滨工业大...

作者

  • 6篇潘平
  • 5篇罗辉
  • 3篇何朝霞
  • 3篇王洋
  • 1篇田庚

传媒

  • 2篇科学技术与工...
  • 2篇中国测试
  • 1篇科技导报
  • 1篇计算机工程与...

年份

  • 1篇2017
  • 1篇2016
  • 1篇2015
  • 1篇2014
  • 1篇2013
  • 1篇2012
6 条 记 录,以下是 1-6
排序方式:
基于量子逻辑线路神经网络的说话人识别方法
2013年
由于说话人的语音信号具有时变性、随机性,其特征参数也呈现出高维及相邻帧变化较大等特点。从量子信息处理理论出发,将一帧语音信号视为一个量子态,在传统神经网络的基础上,利用量子逻辑线路构造神经网络,实现说话人语音信号的有效聚类,探索一种基于量子逻辑线路神经网络的说话人识别模型与方法。利用模型固有的大量全局吸引子,可有效降低语音信号处理的时间及复杂度。通过在经典计算机上模拟仿真,并与BP神经网络说话人识别模型进行对比,表明该方法能够加快说话人识别模型的收敛速率,对参数变化具有更好的鲁棒性,且其系统识别率比BP神经网络方法平均提高了3.34%。
潘平罗辉王洋
关键词:神经网络说话人识别
基于非线性共振的说话人特征提取研究与仿真被引量:4
2012年
针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。
何朝霞潘平罗辉
关键词:语音信号特征提取识别率
一种基于量子势阱组的说话人特征提取方法
2015年
说话人特征提取是说话人识别系统中的关键环节,优良的特征提取算法既能有效反映说话人的基本特征,又能为识别的有效性提供保证。根据量子势阱理论,论文以透射系数、能量和频率的对应关系为切入点,构造出使频率和势阱一一对应的势阱组。针对语音信号的特点,将一帧语音信号视为一个量子态,利用势阱分离能量的特性,通过势阱组提取出信号的能量谱特征,并以此作为特征参数,探索了一种基于量子势垒组的说话人特征提取方法。仿真结果表明,在相同条件下,该方法可以降低算法的复杂性并能够有效的提取说话人特征,为说话人特征提取提供了新的研究方向。
王洋潘平田庚
关键词:特征提取透射系数量子态说话人
音色变换音频信号的篡改检测技术研究被引量:2
2017年
针对音色变换软件带来的社会安全问题,提出一种音频信号篡改检测方法。首先根据语音信号的混沌特性和人耳的听觉特性,利用美尔频率倒谱系数(Mel frequency cepstral coefficients,MFCC)特征提取原理,提取待测音频的杜芬频率倒谱系数(Duffing frequency cepstral coefficients,DFCC),然后将特征参数的幅度进行提升,利用支持向量机(SVM)将特征参数与语料库里的特征进行分类。分类成功的情况下,根据幅度提升的大小判断待测音频信号是否经过篡改;同时根据幅度提升的大小和待测音频的性别判断说话人的真实性别。大量的实验结果表明,该方法在音频信号的篡改检测和音频信号说话人的真实性别判断方面均具有较高的准确率,并且性能稳定。
何朝霞潘平罗辉
关键词:篡改检测特征提取支持向量机
复制粘贴音频信号的篡改检测技术研究被引量:1
2016年
根据数字录音设备在录音过程中不仅记录语音内容本身,还携带微弱的电网信号的特点,提出一种基于电网频率的特征提取和复制粘贴篡改检测方法。方法利用Duffing带通滤波器获取携带电网信号的语音信号,然后提取该语音信号的Mel频标倒谱系数(MFCC),最后将特征参数运用于基于量子模距离的判决模型,对音频信号进行复制粘贴篡改检测。通过实验分析,该方法在数字语音删除、复制粘贴篡改检测方面,具有较高的正确率;音频信号越长,检测的正确率越高;MFCC参数提取过程中,帧长和帧移越小,检测的正确率越高。该方法可为音频信号篡改检测提供一个新的研究方向。
何朝霞潘平罗辉
关键词:篡改检测MFCC
基于量子模距离的说话人识别方法被引量:2
2014年
概率测度和距离测度是模式识别最基本的两种测度,矢量量化算法是典型的基于距离测度的模式识别算法。根据量子模距离测度理论,在矢量量化算法的基础上,探索一种基于量子模距离的说话人识别方法。该方法针对说话人语音的时变性、随机性、特征维数较高等特点,将一帧语音信号视为一个量子态,并根据量子测量理论,对量子态之间进行模距离测量,从而对量子态进行有效的分类和聚类。研究表明该方法能有效地降低语音信号处理的复杂度。在经典计算机上的仿真表明,该方法在运行时间上略优于矢量量化算法,在识别率上明显优于矢量量化算法,为说话人识别的理论研究提供了新的途径。
罗辉潘平王洋
关键词:量子说话人
共1页<1>
聚类工具0