李燕萍
- 作品数:101 被引量:104H指数:7
- 供职机构:南京邮电大学更多>>
- 发文基金:国家自然科学基金浙江省自然科学基金江苏省博士后科研资助计划项目更多>>
- 相关领域:自动化与计算机技术电子电信文化科学语言文字更多>>
- 基于MFCC和HMM的音乐分类方法研究被引量:9
- 2008年
- 采用基于Mel倒谱系数特征的隐马尔可夫模型对音乐进行分类.对音乐通过有监督的学习方式进行聚类,分类时将测试样本归入似然值最大的类别,对同一音频抽取若干样本,对样本识别结果采用投票法判定该音频的音乐类别,使分类的准确率得到进一步的提高.仿真实验对4种分类器在有干扰和无干扰的环境下的分类性能进行了比较,实验结果表明该方法具有更好的抗干扰能力和正确率.
- 张燕唐振民李燕萍邹益
- 关键词:MEL倒谱系数音乐分类隐马尔可夫模型
- 基于说话人风格特征建模的多对多语音转换方法及系统
- 本发明公开了一种基于说话人风格特征建模的多对多语音转换方法及系统,首先提出在StarGAN神经网络中添加多层感知器和风格编码器,实现对说话人风格特征的有效提取和约束,克服了传统模型中one‑hot向量携带说话人信息有限的...
- 李燕萍张成飞
- 基于SE-ResNet STARGAN的多对多说话人转换方法
- 本发明公开了一种基于SE‑ResNet STARGAN的多对多说话人转换方法,基于STARGAN与SE‑ResNet相结合来实现语音转换系统,在残差网络基础上,引入注意力思想和门控机制对各通道的依赖性进行建模,通过全局信...
- 李燕萍曹盼何铮韬
- 文献传递
- 一种非平行语料训练下基于VAE的语音转换方法
- 本发明公开了一种在非平行语料训练条件下基于VAE的语音转换方法,在非平行文本条件下,通过深度神经网络提取瓶颈特征,即Bottleneck特征,然后基于变分自编码模型实现转换函数的学习与建模,在转换阶段,可以实现多说话人对...
- 李燕萍凌云志
- 文献传递
- 基于beta-VAE的多对多语音转换方法
- 本发明公开了一种基于beta‑VAE的多对多语音转换方法,通过引入可调节参数β和C,完成对变分自动编码器(VAE)框架的修改,在提高隐变量解纠缠能力的同时,也改善其在瓶颈层编码能力不足的问题,实现多说话人对多说话人的语音...
- 李燕萍张成飞许吉良张燕
- 文献传递
- 基于特征增强注意力机制的语音欺骗检测方法
- 本发明公开了一种基于特征增强注意力机制的语音欺骗检测方法,包括训练阶段和测试阶段,在训练阶段获取训练语料并进行预处理,构建语音欺骗检测模型,将训练语料的声学特征输入到检测模型中进行模型训练,检测模型包括特征提取和分类两大...
- 李燕萍谭誌诚邵曦丁卓
- 基于自适应高斯聚类的非平行文本条件下的语音转换方法
- 本发明公开了一种基于自适应高斯聚类的非平行文本条件下的语音转换方法,属于语音信号处理技术领域。首先利用基于单元挑选和声道长度归一化相结合的方法对非平行语料进行语音特征参数对齐,然后进行自适应高斯混合模型和双线性频率弯折加...
- 李燕萍左宇涛
- 文献传递
- 基于音素分类的汉语语声转换算法被引量:1
- 2011年
- 提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段的语料音素之间的不均衡,从而提高语音的可懂度与自然度。客观评测结果表明,基于音素分类的语声转换算法与GMM算法相比,谱距离比值平均降低了9.31%;主观听力测试表明,ABX测试结果提高了10.36%,同时MOS得分平均提高了29.33%。
- 李燕萍张玲华丁辉
- 关键词:高斯混合模型
- 基于多尺度信息的编-解码器结构的跨语种语音转换方法
- 本发明公开了一种基于多尺度信息的编‑解码器结构的跨语种语音转换方法,包括训练阶段和转换阶段,训练阶段中编码器对声学特征解耦,获得说话人信息表征和内容表征;编码器和解码器之间采用U型连接,将说话人信息表征从编码器传递到解码...
- 李燕萍刘浩潘磊邵曦
- 非平行文本条件下基于i向量的多对多说话人转换方法
- 本发明公开了一种非平行文本条件下基于i向量的多对多说话人转换方法,包括训练阶段和转换阶段,使用了VAWGAN与i向量相结合来实现语音转换系统,能够较好地提升转换后语音的个性相似度和语音质量,实现了一种高质量的语音转换方法...
- 李燕萍左宇涛张燕
- 文献传递