国家自然科学基金(60875015) 作品数:16 被引量:62 H指数:5 相关作者: 杨鸿武 裴东 郭威彤 梁青青 王全州 更多>> 相关机构: 西北师范大学 兰州交通大学 东北大学 更多>> 发文基金: 国家自然科学基金 教育部科学技术研究重点项目 甘肃省自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 理学 更多>>
歌词到歌曲转换系统的实现 被引量:1 2010年 将文语转换技术与语音修改技术相结合,实现了一个歌词到歌曲的转换系统。首先利用一个文语转换系统将输入的歌词转换为语音,同时从歌曲的MIDI文件中提取歌曲的旋律参数,最后通过旋律控制模型对语音信号的声学特征进行修改,实现由歌词到歌曲的转换。实验结果表明,系统合成的歌曲达到了3.29的平均MOS得分。 李锦珑 杨鸿武 梁青青 裴东 刘慧娟关键词:文语转换 声学特征 基于0.13μm工艺的低电压CMOS场效应管输出电导 被引量:1 2009年 对采用0.13μm工艺(p13)低电压工作条件下的CMOS模拟集成电路设计中场效应管的模型参数输出电导gd进行了研究,给出了设计公式。根据所研究的结果设计了一个两级运算放大器电路并进行了仿真。仿真结果与设计结果吻合得很好,证明了设计公式的有效性。 杨志民 马义德 马永杰 摆玉龙 杨鸿武关键词:半导体技术 集成电路 语谱分析的FPGA实现 被引量:3 2011年 语谱是语音信号短时时频分析结果的图形显示,能够清楚地揭示语音信号的时变频谱特性,反映语音信号的动态频谱特性和时域变化特性,在语音信号的分析以及语音学的研究中具有重要的价值。该文利用短时傅里叶变换(Short Time Fourier Transform,STFT)方法对语音信号进行分析,采用了一种按时域抽取基-4 FFT算法实现流水线结构的蝶形运算单元,在FPGA上实现了语音信号的语谱分析,并利用非线性映射算法实现了语谱的VGA显示。 孙红英 杨鸿武 陶中幸关键词:时频分析 蝶形运算单元 普通话到西安话的韵律转换 方言语音的转换是人机交互领域的一个重要研究课题。为实现方言语音的转换,需要建立方言语音的韵律模型。本文分析研究了西安方言的特点,设计了一个包括文本语料和语音语料的面向言语工程的西安方言语料库,文本语料由单音节字、双音节词... 郭威彤 梁青青 裴东 李锦珑 杨鸿武关键词:语料库 韵律模型 文献传递 基于加权Mel倒谱系数的说话人识别 被引量:3 2009年 说话人识别中的首要问题是从语音信号中提取能唯一表现说话人个性特征的有效而稳定可靠的特征参数。把感知加权技术应用到Mel倒谱分析中,通过对基于心理声学模型计算得到的信号掩蔽比插值获得权重函数,并将权重函数应用到Mel倒谱分析中获得加权Mel倒谱系数(WMCEP),以此为特征进行说话人识别。实验结果表明,WMCEP比MFCC和Mel倒谱系数(MCEP)能更好地逼近说话人的谱包络,在噪声环境下的鲁棒性更好,因此其识别性能要优于MFCC和MCEP。 刘亚丽 杨鸿武 黄德智关键词:特征提取 说话人识别 加权 基于压缩感知过程的语音增强 压缩感知(compressive sensing,CS)是一种基于信号稀疏性的采样方法,可以有效提取信号中所包含的信息。该文提出了一种基于CS过程的语音增强新算法。算法利用语音在离散余弦变换(discrete cosin... 周小星 王安娜 孙红英 杨鸿武关键词:语音增强 压缩感知 离散余弦变换 HADAMARD矩阵 文献传递 基于经验模态分解和短时分析的说话人研究 本文提出了一种新的基于经验模态分解和短时分析的说话人研究方法。在特征提取上,利用希尔伯特-黄变换中的经验模态分解法获得语音信号的固有模态函数,再结合短时分析技术获得语音信号的特征参数;在识别算法上,采用传统高斯混合模型进... 刘亚丽 杨鸿武 周慧关键词:说话人识别 高斯混合模型 文献传递 基于EMD的声纹特征参数提取 被引量:4 2009年 提出了一种新的结合支持向量机(SVM)、经验模态分解(EMD)和短时处理技术的声纹识别方法,将EMD分解和短时处理技术相结合提取特征参数,采用SVM实现声纹识别.实验结果表明,所提出的方法比传统的短时分析+GMM方法在识别率上由92.5%提高到了95.1%. 杨鸿武 刘亚丽 周慧 宋海声关键词:声纹识别 基于语法树高度的汉语韵律短语预测 被引量:6 2010年 在文语转换系统中,从文本中预测出准确的韵律结构对于提高合成语音的自然度具有重要的作用。利用10 000句标注了词性标记的文本语料,在语言学专家的指导下,人工标注了语料的韵律词和韵律短语。选择了标注结果一致性最高的500句语句,标注了语法层级结构,并利用语法树高度描述语法词之间连接的紧密程度。通过分析韵律短语边界与语法结构的关系,发现韵律短语边界受语法树高度、语法词词性和语法词词长的影响,因此选择了这三个特征,利用TBL算法和400句训练语句训练了预测模型。测试集上的预测结果表明,提出的方法在小规模训练语料下,韵律短语预测的精确率达到了75.2%,召回率达到了77.1%,F-Score达到了76.1%。 杨鸿武 王晓丽 陈龙 裴东 郭威彤 蔡莲红关键词:语法结构 韵律短语 基于现场可编程门阵列的语谱图显示与增强 被引量:2 2011年 在基于现场可编程门阵列(FPGA)的语谱分析研究与设计中,直接显示的语谱图不能够体现语谱的细节变化情况,针对这一问题,提出了一种适合FPGA实现的语谱图增强显示的方法。该方法通过非线性变换,将高灰度分辨率图像压缩为低灰度分辨率图像,能更好地体现语谱图的细微变化。由于人眼对灰度的分辨能力远低于对色彩的分辨能力,对灰度图像进行了伪彩色处理,并将结果通过视频图形阵列(VGA)方式显示。实验结果表明,通过该方法可以获得更多的语谱图所表达的视觉细节信息。 陶中幸 裴东 王全州 杨鸿武 裴会新关键词:现场可编程门阵列 语谱图 短时傅里叶变换 伪彩色