哈尔滨市青年科技创新人才专项资金项目(2007RFQXG097) 作品数:3 被引量:4 H指数:1 相关作者: 吕成国 于向丽 付浩楠 金玉卿 更多>> 相关机构: 黑龙江大学 更多>> 发文基金: 哈尔滨市青年科技创新人才专项资金项目 更多>> 相关领域: 电子电信 更多>>
情感变异的语音语料库的设计和构建 2011年 针对情感变异的语音分类与识别研究的需要,给出了情感变异的语音语料库的构建流程和制作规范,设计并建立了情感变异的语音语料库。现已录制的语料包含自然、高兴、悲伤和愤怒四种情感类型,共1 600条语句。为了证明该情感变异的语音语料库的有效性,对其所有数据进行了听辨实验检测。结果表明,设计并构建的情感变异的语音语料库具有较高的实用价值,为情感变异的语音的分类与识别的研究奠定了夯实的基础。 金玉卿 吕成国关键词:语料库 听辨实验 近场声源定位算法研究 被引量:3 2011年 麦克风阵列声源定位可为在复杂环境下的说话人的空间位置估计提供有效的解决方案。而传统的应用于雷达,声呐系统领域的阵列信号处理理论已趋于完美,很多应用于阵列信号处理的算法加以修改就可以用来进行麦克风阵列的声源定位。以阵列信号处理中的经典算法MUSIC(Multiple Signal Classification)算法为原型,同时根据语音信号在应用中的特点,介绍了一种基于近场的信号模型,并以此为依据对算法进行改进,使声源定位更加精确。对此算法进行了仿真实验,仿真结果表明,此算法具有良好的定位性能,并随着信号信噪比的上升,性能有所提高。 于向丽 吕成国关键词:语音信号处理 麦克风阵列 声源定位 子空间方法 话者识别系统改进策略的研究 在说话人识别系统中,系统的响应速度是影响系统性能的一个重要的因素。为了提高说话人识别系统的响应速度,将说话人模型间距离测算的方法引入到系统的识别过程之中。在距离测算方法的基础上,提出了一种方法在说话人系统识别之前进行预处... 冯朝斌 吕成国 赵洪刚关键词:说话人识别 文献传递 基于区分性GMM文本无关的话者识别的研究 被引量:1 2011年 说话人识别的关键在于如何为集合中的每一个人建立一个能表征该说话人个性特征的声学模型,建模方法将会严重影响系统的性能。基于当今与文本无关的话者识别的主流模型——高斯混合模型(Gaussian Mixture Model,GMM)的基础上,从声学的角度剖析了男女发音的差别,以增加说话人之间的差异性为出发点,引入竞争性思想和通用背景模型(Universal Background Model,UBM),提出了具有区分性的GMM的建模方法,克服了传统GMM需要大量训练样本的局限性和UBM将说话人强制服从统一分布的弱点。最后实验的对比结果表明,具有区分性的GMM相比传统的高斯混合模型在识别率上有所提高。 付浩楠 吕成国关键词:说话人识别 EM算法 区分性 基于SVM的与文本无关的说话人拒识策略的研究 在说话人识别系统中,说话人的检测和拒识是非常重要的。现在有些说话人识别系统要求在线识别,实时性要求很高。针对这一要求,本文提出了一种与高斯混合模型(GMM)相结合的基于支持向量机(SVM)的快速拒识算法,并将其应用于实时... 朱君 吕成国关键词:支持向量机 说话人识别 文献传递