2024年11月30日
星期六
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
张陈昊
作品数:
4
被引量:3
H指数:1
供职机构:
清华大学计算机科学与技术系
更多>>
发文基金:
国家自然科学基金
国家重点基础研究发展计划
更多>>
相关领域:
电子电信
自动化与计算机技术
更多>>
合作作者
郑方
清华大学计算机科学与技术系
王琳琳
清华大学计算机科学与技术系
邬晓钧
清华大学计算机科学与技术系
白静
太原理工大学信息与计算机学院
龚宬
清华大学计算机科学与技术系
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
2篇
期刊文章
2篇
会议论文
领域
3篇
电子电信
1篇
自动化与计算...
主题
2篇
说话人辨认
1篇
音素
1篇
语音
1篇
语音识别
1篇
说话人确认
1篇
说话人确认系...
1篇
说话人识别
1篇
文本无关
1篇
鲁棒
1篇
鲁棒性
1篇
类模型
1篇
感知
机构
4篇
清华大学
1篇
太原理工大学
1篇
奥克兰大学
作者
4篇
张陈昊
4篇
郑方
3篇
王琳琳
2篇
邬晓钧
1篇
尹聪
1篇
龚宬
1篇
白静
传媒
2篇
清华大学学报...
年份
2篇
2013
2篇
2011
共
4
条 记 录,以下是 1-4
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于多音素类模型的文本无关短语音说话人识别
被引量:1
2013年
对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。
张陈昊
郑方
王琳琳
关键词:
语音识别
基于参考说话人模型和双层结构的说话人辨认快速算法
王刚
邬晓钧
郑方
王琳琳
张陈昊
基于参考说话人模型和双层结构的说话人辨认快速算法
王刚
邬晓钧
郑方
王琳琳
张陈昊
基于PLAR的说话人确认系统的噪音鲁棒性
被引量:2
2013年
针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。
尹聪
白静
龚宬
张陈昊
郑方
Waleed H.Abdulla
关键词:
说话人确认
鲁棒性
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张