您的位置: 专家智库 > >

姚志强

作品数:11 被引量:27H指数:3
供职机构:中国科学技术大学信息科学技术学院电子工程与信息科学系更多>>
发文基金:国家自然科学基金安徽省自然科学基金国家高技术研究发展计划更多>>
相关领域:电子电信自动化与计算机技术语言文字更多>>

文献类型

  • 6篇期刊文章
  • 2篇学位论文
  • 2篇会议论文
  • 1篇科技成果

领域

  • 9篇电子电信
  • 2篇自动化与计算...
  • 1篇语言文字

主题

  • 8篇语音
  • 7篇语音识别
  • 3篇鲁棒
  • 3篇鲁棒性
  • 2篇说话人识别
  • 2篇文本无关
  • 2篇相关系数
  • 2篇话者确认
  • 2篇话者识别
  • 2篇HMM
  • 1篇信息提取
  • 1篇音段
  • 1篇语音识别方法
  • 1篇噪声
  • 1篇噪声鲁棒性
  • 1篇神经网
  • 1篇神经网络
  • 1篇神经网络融合
  • 1篇识别方法
  • 1篇矢量

机构

  • 11篇中国科学技术...
  • 1篇浙江理工大学

作者

  • 11篇姚志强
  • 4篇戴蓓蒨
  • 3篇王仁华
  • 3篇陈思宝
  • 3篇胡郁
  • 2篇周曦
  • 2篇戴蓓倩
  • 2篇李辉
  • 2篇吴礼福
  • 1篇陈雁翔
  • 1篇李辉
  • 1篇黄南晨
  • 1篇李霄寒
  • 1篇黄伟
  • 1篇黄伟

传媒

  • 1篇电子与信息学...
  • 1篇中国科学技术...
  • 1篇清华大学学报...
  • 1篇数据采集与处...
  • 1篇信息与控制
  • 1篇计算机工程与...
  • 1篇第九届全国人...
  • 1篇第九届全国人...

年份

  • 1篇2008
  • 3篇2007
  • 2篇2006
  • 1篇2005
  • 3篇2004
  • 1篇2003
11 条 记 录,以下是 1-10
排序方式:
基于HMM-UBM和短语音的说话人身份确认被引量:3
2004年
提出了一种简单有效的与说话人有关的阈值设置方法 ,同时在确认系统中采用高斯混合模型(GMM)作为背景模型来模拟未知的冒认者的语音 ,在冒认文本多样化的情况下获得了比用隐马尔可夫模型(HMM)作背景模型更好的性能 .本文在此基础上实现了一个基于Internet的与文本有关的远程语音身份认证系统 ,在实验测试和应用测试中均获得了满意的确认性能 .
李霄寒黄南晨戴蓓蒨姚志强
关键词:说话人确认
基于多带HMM和神经网络融合的语音识别方法的信道鲁棒性被引量:6
2004年
对于基于HMM的语音识别系统,由于训练和测试环境(背景噪声。语音传输信道Microphone等)的失配将会造成识别性能的严重下降。根据人类的听觉感知机理,该文针对语音传输信道失配问题,提出了一种基于多带HMM的系统结构,有若干个子带系统和一个全频带子系统组成,并采用神经网络对个子系统的输出进行后端融合及判决。实验表明,这种方法可以有效地提高识别系统的信道鲁棒性。
姚志强戴蓓倩李辉黄伟
关键词:神经网络融合
用于文本无关的话者识别的超音段信息提取被引量:2
2005年
提出一种可用于较少语音数据量的文本无关的超音段信息提取方法。通过对基音和能量的轨迹动态分段,提取超音段信息,并使用异方差线性区分分析(HLDA)进行参数优化,克服超音段信息提取对数据量大小的依赖,同时采用混合高斯-统一背景(GMM-U BM)模型结构,建立文本无关话者识别系统。在N IST′01数据库上的实验表明,该系统性能优于基于短时帧的音源信息参数系统,更重要的是不需要大数据量的支持,且与基于短时帧倒谱参数的话者识别系统融合后,系统识别性能明显改善,等误识率相对下降10%。
姚志强吴礼福戴蓓蒨周曦
关键词:话者确认基音文本无关
文本无关说话人识别中一种改进的模型PCA变换方法被引量:5
2007年
对于采用高斯混合模型(GMM)的与文本无关的说话人识别,出于模型参数数量和计算量的考虑GMM的协方差矩阵通常取为对角矩阵形式,并假设观察矢量各维之间是不相关的。然而,这种假设在大多情况下是不成立的。为了使观察矢量空间适合于采用对角协方差的GMM进行拟合,通常采用对参数空间或模型空间进行解相关变换。该文提出了一种改进模型空间解相关的PCA方法,通过直接对GMM的各高斯成分的协方差进行主成分分析,使参数空间分布更符合使用对角化协方差的混合高斯分布,并通过共享PCA变换阵的方法减少参数数量和计算量。在微软语音库上的说话人识别实验表明,该方法取得了比常规的对角协方差GMM系统的最优结果有相对35%的误识率下降。
姚志强周曦戴蓓蒨
关键词:话者识别解相关
说话人识别中提高GMM性能方法的研究
利用语音信号进行说话人身份识别,是语音研究领域的一个重要方向,具有越来越重要的社会意义和实用价值。根据说话的内容,可以分为文本相关和无关两个方面。由于文本无关具有更加灵活与适用面广的特点而成为主要研究课题。  在文本无关...
姚志强
关键词:语音识别说话人识别参数估计特征矢量
音源特征用于提高话者确认系统的鲁棒性被引量:2
2006年
给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数:短时(单帧)特征参数和较长时(多帧)特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线性加权对主、辅子系统的输出进行融合.在NIST’03数据库上100个男性话者的对比实验表明,音源特征参数具有良好的噪声鲁棒性,声道特征与音源特征具有较强的互补性,尤其是在较强的噪声背景下,利用音源特征可以有效地提高以声道倒谱参数为特征的确认系统的鲁棒性.
吴礼福姚志强戴蓓蒨李辉
关键词:话者确认噪声鲁棒性
基于多信息融合的Robust语音识别方法和模型的研究
戴蓓倩李辉黄伟陈雁翔姚志强
项目主要研究基于人类的听觉感知机理和多信息融合的Robust语音识别方法和模型。取得的主要进展和研究成果如下:提出了一种基于子带特征、子带模型的多子系统结构和用神经网络进行系统级融合的方法;提出了一种基于分类特征子空间的...
关键词:
关键词:语音识别鲁棒性
基于树的相关系数补偿满方差建模技术被引量:1
2008年
为了实现语音识别中基于隐Markov模型(hidden Markov model,HMM)的满方差建模,该文提出了基于树的相关系数的补偿方法。首先自顶向下构建状态的回归树,用简化的仅考虑协方差的对称Kullback-Leibler散度来度量Gauss之间的差异。每个Gauss核接到相应状态下作为叶子节点。叶子节点的相关系数矩阵用其父节点及祖先节点的相关系数矩阵的线性插值得到。线性插值权在最大似然意义下进行优化。实验结果显示取得的识别性能相对异方差线性判别分析、半绑定协方差、基于树的协方差非对角补偿方法的字误识率分别相对下降9.71%、9.17%和4.12%。
陈思宝姚志强胡郁王仁华
关键词:语音识别相关系数
基于树的相关系数补偿满方差建模技术研究
为了实现语音识别中基于HMM 的满方差建模,本文提出了基于树的相关系数的补偿方法。首先自顶向下构建状态的回归树,用简化的仅考虑协方差的对称Kullback–Leibler散度来度量高斯之间的差异。每个高斯核接到相应状态下...
陈思宝姚志强胡郁王仁华
关键词:语音识别相关系数
文献传递
Robust语音识别方法研究
该文研究环境失配情况下的提高语音识别系统鲁棒性的方法.以基于HMM的语音识别系统为基础,提出在系统级提高识别系统鲁棒性的识别方法.首先从语音受污染的机理以及统计建模的角度分析、阐述了环境失配造成识别性能下降的原因.对特征...
姚志强
关键词:语音识别鲁棒性
文献传递
共2页<12>
聚类工具0