黄申
- 作品数:11 被引量:7H指数:2
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术语言文字文化科学更多>>
- 基于广义流利的口语流利度自动评估方法
- 本发明为基于广义流利的口语流利度自动化评估方法,包括:利用语音输入设备,分不同年龄和口语水平收集语音数据;采用基于广义流利度的特征和机器学习训练流利度评测模型;根据语音数据不同话题的脚本和发音者的性别,配置相应参数的语音...
- 徐波黄申梁家恩高鹏王士进李鹏
- 文献传递
- 语音输入设备使用异常的检测方法及系统
- 本发明公开了一种语音输入设备使用异常的检测方法及系统。本发明采用对远讲语音信号表征更全面、更趋近于人感知的特征提取方式,从而可以粗略的判断背景语音,正常语音和远讲语音。在音频信号分类的基础上,采用现代信号处理技术和统计机...
- 徐波黄申王士进李宏言陈振标柯登峰高鹏李鹏
- 文献传递
- 辅助语音评分系统中一种流利度自动评分方法被引量:5
- 2009年
- 流利度评分是目前计算机辅助自动发音评分系统中一个重要组成部分。为了解决流利度特征表述中和内容、韵律等高级表述技巧相关的广义流利问题,该文提出了一种能够全面客观地评价口语流利度通顺性和韵律性的评分方法。该方法除了通顺性之外,可以提取停顿、韵律、连读和失去爆破等特征;评分过程中,系统采用多层次融合方法,分别从句子级和篇章级提取流利度特征,其中篇章级得分由句子级加权得分和篇章级特征进行融合得到。在实验中,分别以机器得分和人工平均分的相关度、均方差等指标比较了多元线性回归(LR)、BP神经网络、支持向量回归机(SVR)3种算法的性能。结果表明:基于非线性建模的BP神经网络和支持向量回归机拟合的得分模型要好于多元线性回归;该方法可以作为一个重要指标,应用在计算机辅助语音评分系统中。
- 黄申李宏言王士进梁家恩徐波
- 关键词:计算机辅助语言学习语音识别流利度
- 基于多系统融合的实用化英语词重音错误检测方法
- 李宏言黄申王士进梁家恩徐波
- 关键词:词重音
- 英语口语重复修正检错中语法网络和搜索过滤算法
- 2011年
- 针对口语重复修正检错这一计算机辅助语言教学中的难点,提出一种基于音节单元WFST(weighted finite-state transducer)网络的容错对齐和搜索过滤算法。该算法将对齐后识别结果中邻近匹配词所对应的脚本建立上述语法网络进行二次识别下的容错对齐,得到的候选被修改部分和替换部分作为搜索过滤的查询和模板。最终,重复修正检错结果由搜索过滤算法的置信度决定。为此,提出了基于顺序假设的k-difference算法和基于随机假设的n-gram算法。实验表明:不使用二次容错对齐时,以音节为建模单元的多n-gram混合搜索过滤取得了相对最优的结果;使用二次容错对齐时,能够使F-measure获得3~4个百分比的进一步提升。
- 黄申李宏言王士进徐波
- 关键词:计算机辅助语言教学流利度
- 语音输入设备使用异常的检测方法及系统
- 本发明公开了一种语音输入设备使用异常的检测方法及系统。本发明采用对远讲语音信号表征更全面、更趋近于人感知的特征提取方式,从而可以粗略的判断背景语音,正常语音和远讲语音。在音频信号分类的基础上,采用现代信号处理技术和统计机...
- 徐波黄申王士进李宏言陈振标柯登峰高鹏李鹏
- 基于动态规划的清唱评分与纠错系统设计与实现
- 随着音频处理技术的发展,对歌曲演唱进行自动评价逐渐引起了大家的兴趣。本文结合音频信号处理技术和动态规划的搜索算法,提出了一种利用音高序列和音符时长序列对清唱语音进行自动评价的方法,在此基础上,实现了清唱评分和清唱纠错系统...
- 王磊黄申胡晟姜洪臣徐波
- 关键词:动态规划算法
- 文献传递
- 基于动态规划的清唱评分与纠错系统设计与实现
- 随着音频处理技术的发展,对歌曲演唱进行自动评价逐渐引起了大家的兴趣。本文结合音频信号处理技术和动态规划的搜索算法,提出了一种利用音高序列和音符时长序列对清唱语音进行自动评价的方法,在此基础上,实现了清唱评分和清唱纠错系统...
- 王磊黄申胡晟姜洪臣徐波
- 关键词:动态规划算法音频处理
- 文献传递
- 基于广义流利的口语流利度自动评估方法
- 本发明为基于广义流利的口语流利度自动化评估方法,包括:利用语音输入设备,分不同年龄和口语水平收集语音数据;采用基于广义流利度的特征和机器学习训练流利度评测模型;根据语音数据不同话题的脚本和发音者的性别,配置相应参数的语音...
- 徐波黄申梁家恩高鹏王士进李鹏
- 基于GMM-UBM和GLDS-SVM的英文发音错误检测方法被引量:3
- 2010年
- 将语种和说话人识别的方法应用到英语发音错误检测系统,提出一种基于广义线性区分序列支持向量机(Generalized linear dis-criminant sequence based SVM,GLDS-SVM)的发音错误检测方法.主要创新点为:1)提出一种基于状态拼接的特征规整方案,增强SVM对发音特征的建模能力;2)提出一种基于多模型融合的模型训练策略,该策略可以更加充分地利用训练数据,并在一定程度上解决了由于真实发音错误数据缺乏造成的正负样本不均衡的问题;3)将GLDS-SVM与基于通用背景模型GMM(Universal background modelsbased GMM,GMM-UBM)的方法进行融合,以进一步提高发音检错性能.GLDS-SVM和GMM-UBM的融合系统在仿真测试集和真实测试集上的等错误率(Equal error rate,EER)分别达到9.92%和16.35%.同时,GLDS-SVM在模型占用空间和运算速度方面均比传统径向基函数(Radial basic function,RBF)核方法具有明显优势.
- 李宏言黄申王士进梁家恩徐波
- 关键词:计算机辅助语言学习