梁家恩 作品数:22 被引量:12 H指数:3 供职机构: 中国科学院自动化研究所 更多>> 发文基金: 国家高技术研究发展计划 国家重点基础研究发展计划 更多>> 相关领域: 电子电信 自动化与计算机技术 语言文字 文化科学 更多>>
基于Multilingual的音素识别及其在语种识别中的应用 被引量:2 2008年 国际上对自动语种识别进行了广泛的研究,提出了各种各样的方法,美国国家标准技术研究所(NIST)多年的评测表明,基于并行音素识别(parallel phoneme recognition language modeling,PPRLM)的方法取得了很好的性能。该文提出了一种基于多种语言的音素识别方法的自动语种识别系统,系统中Multilingual音素集是使用基于数据驱动聚类获得。通过真实环境电话语音测试表明,该方法在只使用了很少的识别时间的情况下,获得了跟传统的PPRLM系统可比的识别正确率。同时经过与PPRLM系统融合后,获得了更好的性能,跟其他主流的几种语种识别方法也有可比的性能。 王士进 孟猛 梁家恩 徐波关键词:信息处理 多语种 音素识别 语种识别 辅助语音评分系统中一种流利度自动评分方法 被引量:5 2009年 流利度评分是目前计算机辅助自动发音评分系统中一个重要组成部分。为了解决流利度特征表述中和内容、韵律等高级表述技巧相关的广义流利问题,该文提出了一种能够全面客观地评价口语流利度通顺性和韵律性的评分方法。该方法除了通顺性之外,可以提取停顿、韵律、连读和失去爆破等特征;评分过程中,系统采用多层次融合方法,分别从句子级和篇章级提取流利度特征,其中篇章级得分由句子级加权得分和篇章级特征进行融合得到。在实验中,分别以机器得分和人工平均分的相关度、均方差等指标比较了多元线性回归(LR)、BP神经网络、支持向量回归机(SVR)3种算法的性能。结果表明:基于非线性建模的BP神经网络和支持向量回归机拟合的得分模型要好于多元线性回归;该方法可以作为一个重要指标,应用在计算机辅助语音评分系统中。 黄申 李宏言 王士进 梁家恩 徐波关键词:计算机辅助语言学习 语音识别 流利度 一种运用计算机对开放式短对话进行交互式评分的方法 本发明提出了一种运用计算机对开放式短对话进行交互式评分的方法,包括以下步骤:语音数据库的收集和声学模型的训练、专家知识的获取和评分模型的训练、样本语音信号的特征提取和关键内容检索、未检测到合法专家知识的语音内容聚类和类的... 王士进 梁家恩 徐波基于客观标准的自动化口语评估系统 本发明为基于客观标准的自动化口语评估系统,包括识别对齐单元、量化评估单元和标准调整单元,识别对齐单元接收口语语音信息、答题范围和评估指标信息,对输入口语语音信息进行识别和对齐,将口语语音信息生成文字,并将文字和语音进行对... 梁家恩 徐波 王士进 高鹏 李鹏基于广义流利的口语流利度自动评估方法 本发明为基于广义流利的口语流利度自动化评估方法,包括:利用语音输入设备,分不同年龄和口语水平收集语音数据;采用基于广义流利度的特征和机器学习训练流利度评测模型;根据语音数据不同话题的脚本和发音者的性别,配置相应参数的语音... 徐波 黄申 梁家恩 高鹏 王士进 李鹏基于语音样本的口语电话语音关键词检出算法的改进研究 以语音样本作为输入,实现口语电话语音的关键词检出是本文的目的。文中提出的通过建立音素混淆网络进行扩展的算法,提高了由语音样本转化成声学模型序列的效果,扩展了基于语音样本方法的应用范围。尤其在说话人无关、口语化电话语音的情... 孟猛 梁家恩 徐波关键词:关键词检出 文献传递 一个面向广播语音识别的语言模型自适应框架 2007年 语言模型自适应的目的是减小模型与识别任务之间的语言差异。这些差异包括词典差异、风格和内容差异以及模型的概率分布差异。本文提出一种新的非迭代的中文新词提取方法和一种新的开放式词典的中文语言模型。基于这些技术,本文提出一个面向广播语音识别的语言模型自适应框架,该框架联合了以下技术:一种新的非迭代的新词提取方法,一种新的中文开放式词典语言模型,一种基于困惑度(PPL)的背景语料筛选方法和一个N-gram概率分布自适应模块。另外,本文还专门分析了在语言模型自适应过程中命名实体词的识别情况。实验表明,通过使用该框架,误识率相对下降了10%,实体词识别准确率提高了4%。 王晓瑞 丁鹏 梁家恩 徐波关键词:计算机应用 中文信息处理 基于广义流利的口语流利度自动评估方法 本发明为基于广义流利的口语流利度自动化评估方法,包括:利用语音输入设备,分不同年龄和口语水平收集语音数据;采用基于广义流利度的特征和机器学习训练流利度评测模型;根据语音数据不同话题的脚本和发音者的性别,配置相应参数的语音... 徐波 黄申 梁家恩 高鹏 王士进 李鹏文献传递 基于音素聚类的多语言声学建模方法 被引量:1 2009年 首先提出以音素合并后模型自身似然度下降为距离依据,通过聚类生成多语言通用音素的声学建模方法.在此基础上,比较聚类时增加两种约束条件(同一语种内音素不聚类、不同IPA族的音素不聚类)对性能的影响.同时,对通用音素集的规模对识别性能的影响做了一定探索.最后的实验给出建立中英文双语混合模型在关键词检测系统上的结果,比较4种聚类方法在不同通用音素个数情况下的性能优劣.结果显示,使用本文方法进行一定程度的音素合并,性能比不作聚类直接混合建模有明显提升.适当增加音素聚类的约束,有助于进一步提高性能. 孟猛 梁家恩 徐波关键词:关键词检测 运用计算机对口语翻译质量进行评分的方法 本发明一种运用计算机对口语翻译质量进行评分的方法综合使用计算机语音识别、语音发音评估、文本翻译质量确认技术得到被测试人员的口语翻译质量,包含建立针对被测试发音人群特点的数据库,然后在此数据库基础上使用大词汇连续语音声学模... 王士进 徐波 梁家恩 高鹏 李鹏文献传递