孙健
- 作品数:9 被引量:29H指数:3
- 供职机构:解放军理工大学通信工程学院更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 一种基于DCT和PSOLA的语音变换方法
- 本文提出了一种基于离散余弦变换(DCT)和基音同步叠接相加(PSOLA)的语音变换方法。此方法可以自由调整源语音的基音频率、能量分布和时长,以达到变换要求,并且变换后的语音具有很高的质量。变换方法首先对基音标记过的语音段...
- 孙健贾永兴
- 关键词:语音变换离散余弦变换
- 文献传递
- 一种新的量子神经网络训练算法被引量:14
- 2011年
- 量子神经网络是一种借鉴量子理论中的态叠加思想而设计的单隐层前馈神经网络,其主要用于数据分类。由于采用多层激励函数神经元,并且在量子间隔训练中采用了新的目标函数,即同类输入数据的隐层节点输出方差最小,从而使量子神经网络具备了发掘不同类别数据间模糊性的能力。但由于训练时对量子神经网络权值和量子间隔使用了不同的目标函数,使迭代过程中两者不可避免的会出现相互冲突,从而导致训练迭代次数的增加和网络性能的下降。本文借鉴约束优化理论,在两个目标函数的梯度下降求解中引入了惩罚函数,提出了一种新的量子神经网络训练算法,消除了两个目标函数间的冲突。实验结果表明,本文提出的训练算法可以显著提升训练的速度和网络的性能。
- 孙健张雄伟孙新建
- 关键词:量子神经网络梯度下降惩罚函数
- 复杂背景下的模版匹配车牌定位算法改进被引量:1
- 2008年
- 本文在车牌定位算法模板匹配法[1]的基础上,针对复杂背景下,存在强干扰区的情况,进行了算法改进。改进算法在原有算法的基础引入备选区域,再通过纵向叠减排大法和纵向投影叠减法对备选区域进行二次筛选,最后定位出正确的车牌位置。经实验验证,针对复杂背景对于车牌定位的影响,此改进方法在不过多增加开销的前提下,大大提高了定位的准确率。
- 孙健杨庆陈向东
- 关键词:车牌定位
- 基于卷积非负矩阵分解的语音转换方法被引量:12
- 2013年
- 为了在语音转换过程中充分考虑语音的帧间相关性,提出了一种基于卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可较好地保存语音信号中的个人特征信息及帧间相关性。利用这一特性,在训练阶段,通过卷积非负矩阵分解从训练数据中提取源说话人和目标说话人相匹配的时频基。在转换阶段,通过时频基替换实现对源说话人语音的转换。相对于传统方法,本方法能够更好地保存和转换语音帧间相关性。实验仿真及主、客观评价结果表明,与基于高斯混合模型、状态空间模型的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度。
- 孙健张雄伟曹铁勇杨吉斌孙新建
- 关键词:语音转换
- 一种新的量子神经网络训练算法
- 量子神经网络是一种借鉴量子理论中的态叠加思想而设计的单隐层前馈神经网络,其主要用于数据分类。由于采用多层激励函数神经元,并且在量子间隔训练中采用了新的目标函数,即同类输入数据的隐层节点输出方差最小,从而使量子神经网络具备...
- 孙健张雄伟孙新建
- 关键词:量子神经网络梯度下降惩罚函数
- 一种量子神经网络说话人识别方法被引量:7
- 2012年
- 针对说话人语音特征空间边界存在模糊性的特点,构建了一种量子神经网络识别分类器,用于说话人识别,以改善存在交叉数据的语音特征参数的分类效果。提出了一种基于人工免疫算法的量子间隔训练方法,以改善传统量子神经网络训练算法的不足。以TIMIT语音库为测试语音,与传统BP网络和基于常规梯度下降量子间隔训练算法的量子神经网络做对比实验。实验证明,算法能有效提高说话人识别系统的识别率,同时与高斯混合模型相比,具有更好的抗噪声性能。
- 王金明王耿郑国宏孙健
- 关键词:量子神经网络说话人识别人工免疫算法高斯混合模型
- 基于隐变量模型的语音转换方法研究被引量:2
- 2012年
- 传统语音转换方法利用说话人声音特征映射实现,容易造成过平滑(over-smoothing)和过拟合(over-fitting)问题。本文从语音信号内容与形式分离角度,利用隐变量模型提出了一种全新的语音转换方法。首先利用包含两个隐变量因子的隐变量模型(Latent Variable Model,LVM)建立语音信号的生成模型;然后采用最大似然方法把语音信号分解成表示语义的内容信息和体现说话人特征的形式信息,并估计出模型参数;最后基于LVM生成模型,利用说话人形式替换方法实现语音转换。主、客观测试结果表明,在相同训练集条件下,本文提出的语音转换方法性能明显优于GMM方法,并且隐变量模型和传统的双线性模型(Bilinear Model)相比,由于采用非线性关系描述内容与形式之间的相互作用,因此分离效果更好,语音转换质量更高。
- 孙新建张雄伟杨吉斌曹铁勇孙健
- 关键词:语音转换