孙新建 作品数:8 被引量:40 H指数:4 供职机构: 解放军理工大学通信工程学院 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 更多>> 相关领域: 电子电信 自动化与计算机技术 更多>>
一种新的量子神经网络训练算法 被引量:14 2011年 量子神经网络是一种借鉴量子理论中的态叠加思想而设计的单隐层前馈神经网络,其主要用于数据分类。由于采用多层激励函数神经元,并且在量子间隔训练中采用了新的目标函数,即同类输入数据的隐层节点输出方差最小,从而使量子神经网络具备了发掘不同类别数据间模糊性的能力。但由于训练时对量子神经网络权值和量子间隔使用了不同的目标函数,使迭代过程中两者不可避免的会出现相互冲突,从而导致训练迭代次数的增加和网络性能的下降。本文借鉴约束优化理论,在两个目标函数的梯度下降求解中引入了惩罚函数,提出了一种新的量子神经网络训练算法,消除了两个目标函数间的冲突。实验结果表明,本文提出的训练算法可以显著提升训练的速度和网络的性能。 孙健 张雄伟 孙新建关键词:量子神经网络 梯度下降 惩罚函数 基于加权巴克谱失真的语音质量客观评价算法 被引量:6 2006年 提出了一种基于加权巴克谱失真(W BSD)的语音质量客观评价算法。鉴于不同巴克带谱失真对语音质量的影响程度不同,该算法提出在巴克域中对不同巴克带谱失真进行加权来求失真语音的客观失真测度。并且通过分析改进型巴克谱失真测度(M BSD)中15个巴克带失真与平均意见分(M O S)间的相关度,提出了一组以相关系数幂次方为权重的有效巴克谱失真权重矢量。实验结果表明:与M BSD算法相比,W BSD在算法复杂度没有明显增加的情况下与M O S的相关度提高了3%。 孙新建 邹霞 曹铁勇 张雄伟 赵汉武关键词:语音质量客观评价 相关度 基于双因子高斯过程动态模型的声道谱转换方法 被引量:3 2014年 针对作者已经提出的双因子高斯过程隐变量模型(Two-factorGaussianprocesslatentvariablemodel,TF-GPLVM)用于语音转换时未考虑语音的动态特征,并且模型训练时需要估计的参数较多的问题,提出引入隐马尔科夫模型(Hidden Markov model,HMM)对语音动态特征进行建模,并利用HMM隐状态对各帧语音进行关于语义内容的概率软分类,建立了分离精度更高、运算负荷较小的双因子高斯过程动态模型(Two-factor Gaussian process dynamic model,TF-GPDM).基于此模型,设计了一种全新的基于说话人特征替换的语音声道谱转换方案.主、客观实验结果表明,无论是与传统的统计映射和频率弯折转换方法相比,还是与双因子高斯过程隐变量模型方法相比,本文方法都获得了语音质量和转换相似度的提升,以及两项性能的更佳平衡. 孙新建 张雄伟 杨吉斌 曹铁勇 钟新毅关键词:隐马尔科夫模型 基于卷积非负矩阵分解的语音转换方法 被引量:12 2013年 为了在语音转换过程中充分考虑语音的帧间相关性,提出了一种基于卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可较好地保存语音信号中的个人特征信息及帧间相关性。利用这一特性,在训练阶段,通过卷积非负矩阵分解从训练数据中提取源说话人和目标说话人相匹配的时频基。在转换阶段,通过时频基替换实现对源说话人语音的转换。相对于传统方法,本方法能够更好地保存和转换语音帧间相关性。实验仿真及主、客观评价结果表明,与基于高斯混合模型、状态空间模型的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度。 孙健 张雄伟 曹铁勇 杨吉斌 孙新建关键词:语音转换 双向中继信道的模拟网络编码最优功率分配 被引量:4 2014年 在双向信息非对称条件下,研究了基于模拟网络编码的双向中继信道中的最优功率分配问题。分别给出了中断概率最小化、和速率最大化意义下的最优功率分配闭式数学表达式,并证明了两种约束下最优功率分配问题的统一性。分析表明:现有的基于模拟网络编码的双向中继信道中的最优功率分配方法是本文提出方法在某些条件下的特例。计算机仿真分析证明了提出的最优功率分配方法在中断概率和和速率性能方面均优于平均功率分配方法。 钟新毅 徐友云 许魁 孙新建 夏晓晨关键词:最优功率分配 信息非对称 基于隐变量模型的语音转换方法研究 被引量:2 2012年 传统语音转换方法利用说话人声音特征映射实现,容易造成过平滑(over-smoothing)和过拟合(over-fitting)问题。本文从语音信号内容与形式分离角度,利用隐变量模型提出了一种全新的语音转换方法。首先利用包含两个隐变量因子的隐变量模型(Latent Variable Model,LVM)建立语音信号的生成模型;然后采用最大似然方法把语音信号分解成表示语义的内容信息和体现说话人特征的形式信息,并估计出模型参数;最后基于LVM生成模型,利用说话人形式替换方法实现语音转换。主、客观测试结果表明,在相同训练集条件下,本文提出的语音转换方法性能明显优于GMM方法,并且隐变量模型和传统的双线性模型(Bilinear Model)相比,由于采用非线性关系描述内容与形式之间的相互作用,因此分离效果更好,语音转换质量更高。 孙新建 张雄伟 杨吉斌 曹铁勇 孙健关键词:语音转换