您的位置: 专家智库 > >

山西省回国留学人员科研经费资助项目(2013-034)

作品数:12 被引量:54H指数:5
相关作者:张雪英孙颖张卫姚慧畅江更多>>
相关机构:太原理工大学更多>>
发文基金:山西省回国留学人员科研经费资助项目国家自然科学基金山西省青年科技研究基金更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 12篇期刊文章
  • 3篇会议论文

领域

  • 14篇电子电信
  • 3篇自动化与计算...

主题

  • 15篇语音
  • 8篇情感语音
  • 5篇支持向量
  • 5篇支持向量机
  • 5篇向量
  • 5篇向量机
  • 4篇语音情感
  • 4篇语音情感识别
  • 4篇情感识别
  • 3篇学习机
  • 3篇特征提取
  • 3篇极限学习机
  • 3篇核函数
  • 2篇压缩感知
  • 2篇语音去噪
  • 2篇去噪
  • 2篇非线性
  • 2篇感知
  • 2篇PAD
  • 1篇动力学模型

机构

  • 15篇太原理工大学
  • 1篇山西省人民医...

作者

  • 11篇张雪英
  • 10篇孙颖
  • 5篇张卫
  • 3篇畅江
  • 3篇姚慧
  • 2篇李凤莲
  • 2篇张奇萍
  • 2篇宋静
  • 2篇张乐
  • 1篇刘星星
  • 1篇宋磊
  • 1篇张子恒
  • 1篇田玉楚

传媒

  • 3篇微电子学与计...
  • 3篇现代电子技术
  • 2篇第十三届全国...
  • 1篇电子技术应用
  • 1篇计算机工程
  • 1篇天津大学学报...
  • 1篇西安电子科技...
  • 1篇科学技术与工...
  • 1篇中南大学学报...

年份

  • 5篇2017
  • 3篇2016
  • 6篇2015
  • 1篇2014
12 条 记 录,以下是 1-10
排序方式:
人工蜂群算法用于优化KELM参数的研究及应用
针对核函数极限学习机(Extreme Learning Machine with Kernel,KELM)参数优化问题,提出了改进的人工蜂群算法(Improved Artificial Bee Colony,Im-ABC...
张卫张雪英何淑琳
关键词:语音情感识别支持向量机人工蜂群算法
文献传递
基于极限学习机的语音情感识别被引量:3
2015年
提出基于ELM的广义神经网络语音情感识别模型,对基于ELM的单隐层前馈神经网络模型,采用多点交叉和多点变异遗传算法对模型参数进行优化;对基于核函数ELM的广义单隐层前馈神经网络,采用网格搜索寻找模型最优参数组合.对TYUT和EMO-DB情感语音库三种情感(高兴、生气和中性)的识别结果表明,所建立的基于ELM的语音情感识别模型,在泛化性能和训练速度上均优于SVM模型.
何淑琳张雪英孙颖张卫
关键词:语音情感识别支持向量机
基于模糊综合评价法的情感语音数据库的建立被引量:9
2016年
为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该模型对初选阶段的数据库进行模糊评价,筛选得到最终高质量的情感语音数据库。将三种类型的数据库用于情感语音识别实验,对比分析了不同类型数据库的差异,同时也验证了本数据库的有效性。
宋静张雪英孙颖畅江
关键词:层次分析法熵权法
情感语音的非线性动力学特征被引量:14
2016年
基于语音发声过程中的混沌特性,提出了非线性动力学模型与情感语音信号处理相结合的方法.提取了该模型下情感语音的非线性特征:最小延迟时间、关联维数、Kolmogorov熵、最大Lyapunov指数和Hurst指数.设计情感语音识别对比实验以验证非线性特征性能.首先,选用德国柏林语音库和自主录制的TYUT2.0情感语音数据库中的3种情感(高兴、悲伤和愤怒)作为实验数据来源;其次,分别提取非线性特征、韵律特征和梅尔频率倒谱系数特征,采用支持向量机进行了情感识别.结果表明,非线性特征在柏林数据库实验中的识别率高于韵律特征识别率,但是略低于梅尔频率倒谱系数特征识别率,验证了非线性特征是一组区分情感的有效特征;在TYUT2.0数据库中的识别率均高于韵律特征和梅尔频率倒谱系数特征的识别率,在语料真实度和自然度更高的TYUT2.0数据库中识别结果相对更高,鲁棒性更好.
姚慧孙颖张雪英
关键词:动力学模型
基于KELM决策融合的语音情感识别
2017年
针对语音情感信号的复杂性和单一分类器识别的局限性,提出一种核函数极限学习机(KELM)决策融合的方法用于语音情感识别。首先对语音信号提取不同的特征,并训练相应的基分类器,同时将输出转化为概率型输出;然后利用测试集在基分类器的输出概率值计算自适应动态权值;最后对各基分类器的输出进行线性加权融合得到最终的分类结果。利用该方法对柏林语音库中4种情感进行识别,实验结果表明,提出的融合KELM方法优于常用的单分类器以及多分类器融合方法,有效地提高了语音情感识别系统的性能。
张雪英张乐孙颖张卫
关键词:语音情感识别概率矩阵
不同情感语音韵律参数间的曲线回归分析
2014年
韵律特征分析是情感语音研究的重要组成部分。为了更好地预测高兴(积极)以及生气(消极)情感的韵律特征参数和平静(中性)情感参数间的非线性关系,利用曲线回归分析方法对韵律特征参数的统计特性进行了深入研究。并将语音库中的情感语句分为句首、句中、句末三部分分别做研究,将结果与整体间做比较。实验结果表明各韵律参数之间的非线性关系大致相似,为接下来的情感语音研究提供了良好的基础。
刘星星张雪英孙颖
关键词:情感语音非线性
基于聚合经验模态分解的情感语音特征提取被引量:4
2017年
特征提取是情感语音识别系统的关键过程,决定系统整体识别性能。传统特征提取技术假定语音信号是线性、短时平稳信号,不具有自适应性。为此,通过聚合经验模态分解(EEMD)算法以非线性的处理方式提取特征。情感语音信号经EEMD分解后得到一组固有模态函数(IMF),利用相关系数法筛选出有效分量集合,对集合函数计算得到IMF能量特征(IMFE)。选用德国柏林语音库作为实验数据来源,将IMFE特征、韵律特征、梅尔倒谱系数特征以及三者的融合特征分别输入到支持向量机中,通过比较不同特征的识别结果验证IM FE特征的有效性。实验结果表明,IM FE特征与声学特征融合后的平均识别率达到91.67%,可有效区分不同的情感状态。
张乐张雪英孙颖张卫
关键词:特征提取声学特征
基于PAD情绪模型的情感语音识别被引量:10
2016年
简述梅尔频率倒谱系数、线性预测系数、韵律学特征、共振峰频率和过零峰值幅度特征,并将这五种语音特征应用于情感语音识别.根据识别结果从PAD情绪模型的三个维度进行相关性分析得到特征的权重系数,并将识别结果融合映射到PAD三维情绪空间,最终获得情感语音的PAD值.利用情感语音的PAD值可以从连续情感理论对情感语音进行描述分析,采用量化的方法揭示情感空间中各种情绪范畴的定位和关系.
宋静张雪英孙颖张卫
关键词:语音特征
基于模糊认知图的语音情感识别研究
2017年
利用模糊认知图构建一种新的情感语音识别网络,该网络将权值矩阵分为两部分:一部分是特征与情感类别之间的权值,使用实数编码遗传算法学习;另一部分是情感类别与类别之间的权值,使用PAD三维情感模型学习。从数学和心理学两方面对模糊认知图的权值进行学习。针对国际公认的柏林情感语音库(EMO-DB)以及本实验室录制的情感语音库(TYUT)进行仿真实验,验证了方法的有效性,并与BP神经网络进行对比,实验结果表明该方法有较高的识别率。
张卫张雪英孙颖
关键词:模糊认知图实数编码遗传算法PAD语音情感识别
基于压缩感知的语音盲稀疏重构算法及其去噪应用被引量:6
2015年
根据传统的正交匹配追踪(OMP)算法和稀疏度自适应匹配追踪(SAMP)算法各自的缺陷,提出可以在盲稀疏状态下重构带噪语音的多匹配正交追踪(MMOP)算法。该算法采用同时匹配多个原子以及同步增大和缩小原子集的办法来解决SAMP算法中原子的过匹配和欠匹配现象,此外,还提出一种新的去噪思想和设置初始步长方法,并且采用分阶段步长来重构原始语音信号。研究结果表明:本文算法不仅修正SAMP算法的过匹配和欠匹配的现象,而且还具有匹配速度快、迭代次数少的优点,同时又提高语音信号在盲稀疏状态下的重构精度,此外,该算法还可以应用在噪声语音中,有较明显的去噪效果,且其重构后的语音主客观质量评价都要好于传统的OMP算法和SAMP算法。
李凤莲畅江张雪英宋磊田玉楚
关键词:压缩感知语音去噪匹配追踪算法
共2页<12>
聚类工具0