公共文化服务平台

2024年7月12日星期五

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

郑榕: 作品数：9 被引量：18H指数：2; 供职机构：中国科学院自动化研究所更多>>; 发文基金：国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>; 相关领域：自动化与计算机技术电子电信更多>>

合作作者

徐波中国科学院自动化研究所
姜洪臣中国科学院自动化研究所
张树武中国科学院自动化研究所
陈智能中国科学院自动化研究所
冯柏岚中国科学院自动化研究所

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

4篇期刊文章
2篇会议论文
2篇专利
1篇学位论文

领域

4篇自动化与计算...
3篇电子电信

主题

4篇信息处理
4篇语音
4篇中文
4篇中文信息
4篇中文信息处理
4篇计算机
4篇计算机应用
3篇说话人识别
2篇定位计算
2篇新闻
2篇新闻数据
2篇语音检测
2篇语音识别
2篇说话人识别系...
2篇字幕检测
2篇SDC
1篇音素识别
1篇语音处理
1篇语种识别
1篇支持向量

机构

9篇中国科学院自...

作者

9篇郑榕
8篇徐波
3篇姜洪臣
2篇浦剑涛
2篇冯柏岚
2篇张树武
2篇陈智能
1篇江杰
1篇朱磊
1篇王士进

传媒

4篇中文信息学报
1篇第九届全国人...
1篇第九届全国人...

年份

1篇2016
1篇2014
2篇2008
4篇2007
1篇2006

共 9 条记录，以下是 1-9

全选清除导出

排序方式：

一种面向海量广播电视监管的自动新闻拆条方法: 本发明公开了一种面向海量广播电视监管的自动新闻拆条方法，包括以下步骤：初始化广播电视数据自动获得新闻节目音频波形和视频图像；提取新闻数据的音视频特征，包括主持人检测、字幕检测与跟踪和语音检测；通过启发式规则获取新闻条目边...; 冯柏岚郑榕陈智能徐波; 文献传递

基于GMM-UBM的稳健说话人识别系统: 本文介绍了一种基于MFCC倒谱特征和GMM-UBM模型的稳健说话人识别系统，旨在基于当前主流技术的基础上进一步改进系统识别率和噪声鲁棒性，因此本文仅对低层次的声学特征进行提取和建模，并对系统的前端处理进行了如下改进：提出...; 浦剑涛郑榕姜洪臣徐波; 关键词：语音识别语音处理说话人识别系统; 文献传递

一种面向海量广播电视监管的自动新闻拆条方法: 本发明公开了一种面向海量广播电视监管的自动新闻拆条方法，包括以下步骤：初始化广播电视数据自动获得新闻节目音频波形和视频图像；提取新闻数据的音视频特征，包括主持人检测、字幕检测与跟踪和语音检测；通过启发式规则获取新闻条目边...; 冯柏岚郑榕陈智能徐波; 文献传递

基于GMM-UBM的稳健说话人识别系统: 本文介绍了一种基于MFCC倒谱特征和GMM-UBM模型的稳健说话人识别系统,旨在基于当前主流技术的基础上进一步改进系统识别率和噪声鲁棒性,因此本文仅对低层次的声学特征进行提取和建模,并对系统的前端处理进行了如下改进:提出...; 浦剑涛郑榕姜洪臣徐波; 关键词：说话人识别 MFCC CMN SDC; 文献传递

基于SDC特征和GMM-UBM模型的自动语种识别被引量：13: 2007年; 本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以快速得到每个语种的模型。与传统的GMM方法相比,该方法的训练和识别的速度更快。该方法对OGI电话语音库中11个语种进行了测试,其10秒、30秒和45秒句子的最佳识别正确率分别为72.38%、82.62%和85.23%,识别速度约为0.03倍实时。; 姜洪臣郑榕张树武徐波; 关键词：计算机应用中文信息处理

基于特征规整和评分规整的说话人确认研究被引量：4: 2006年; 在说话人确认系统中,训练和测试的声学环境不匹配将造成性能急剧下降。本文提出了从特征规整和评分规整两个方面进行补偿的方法。首先,改进了基于分段的倒谱均值方差规整(SCMVN)方法,将倒谱系数都规整到相同的段内高斯统计分布,以提高不同环境条件下特征匹配程度;其次,针对由于不同说话人和不同测试环境引起的输出评分分布变化,提出了两阶段的评分规整方法,即先零规整再测试规整(TZnorm)和先测试规整再零规整(ZTnorm)两种得分变换方法,使得失配条件下与说话人无关的决策门限更加鲁棒。基于NIST2002说话人识别评测库上的实验表明,采用SCMVN的特征规整和ZTnorm的评分规整方法能够明显地提高系统性能。与采用倒谱均值减和零规整的基线系统相比,等错误率和最小检测代价分别降低了20.3%和18.1%。; 郑榕张树武徐波; 关键词：计算机应用中文信息处理说话人确认

电话语音环境的鲁棒说话人识别: 电话语音环境下说话人识别技术的研究面临许多亟待解决的问题，包括语音环境的通道鲁棒性、说话人差异和系统判决拒识等等。近年来，针对概率统计模型和区分训练框架，研究人员进行了很多有益地探索和研究，这对于说话人识别技术走向实用有...; 郑榕; 关键词：语音识别支持向量机

一种快速说话人搜索算法被引量：1: 2008年; 随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。具体而言,就是采用两遍搜索策略,首先通过建立索引,在索引空间,比较索引间的欧氏距离,粗略地筛选出一定量的候选说话人目标;然后在此基础上,通过更精细的Simulation模型匹配,找出最佳的识别结果。实验结果显示我们的方法能以很小的代价,显著地提高说话人识别的速度。; 朱磊江杰郑榕徐波; 关键词：计算机应用中文信息处理说话人识别

基于词图的音素识别及在语种识别中的应用: 2008年; 本文介绍了一种基于词图的并行音素识别方法的自动语种识别系统,基于词图的并行音素识别方法是并行音素识别方法的一个扩展,它用识别产生的词图来描述声学候选结果空间,比并行音素识别方法中用最佳路径音子序列包含更丰富的信息。通过真实环境广播语音测试表明,该方法比并行音素识别方法识别性能提升了约6%,在每个语种约4小时的训练数据下,跟其他的几种语种识别方法也有可比的性能。; 王士进郑榕徐波; 关键词：计算机应用中文信息处理语种识别

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张