郑铁然
- 作品数:72 被引量:99H指数:7
- 供职机构:哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划教育部跨世纪优秀人才培养计划更多>>
- 相关领域:自动化与计算机技术电子电信语言文字理学更多>>
- 基于总变化空间与分类器联合优化的说话人身份识别方法
- 基于总变化空间与分类器联合优化的说话人身份识别方法,它属于说话人识别技术领域。本发明解决了目前的总变化空间估计方法对说话人身份识别的等错误率高的问题。本发明首先求得训练集均值超矢量在初始总变化空间上的表示;然后对该表示进...
- 韩纪庆陈晨郑贵滨郑铁然
- 文献传递
- 基于锚空间的音频场景识别
- 石自强杨静郑铁然韩纪庆
- 关键词:高斯混合模型
- 网络环境下的语音识别方法被引量:3
- 2005年
- 随着Internet技术的广泛使用,出现了通过Internet来传输语音的新的通信方式——VOIP技术;由此产生了网络环境下语音识别的新问题,这是一个富有挑战性的研究课题。本文将讨论这种网络环境下语音识别的方法和技术。
- 韩纪庆张磊郑铁然
- 关键词:网络环境语音识别方法声码器
- 高斯混合分布之间K-L散度的近似计算被引量:18
- 2008年
- 高斯混合分布之间的K-L散度没有闭式解,通常采用其上界来近似.对于具有相同高斯数的混合分布,基于相对熵链规则推导其K-L散度上界,提出一种更紧上界的计算方法.为计算具有不同高斯数的混合分布之间的K-L散度上界,提出基于最佳高斯分量复制的方法.在中文声韵母声学模型上的实验结果显示,所提出方法可更好地近似等高斯数的混合分布之间的K-L散度,并能有效处理具有不同高斯数的混合分布.
- 王欢良韩纪庆郑铁然
- 关键词:相对熵
- 基于后验概率的汉语语音检索方法研究被引量:2
- 2009年
- 针对经典的向量空间检索模型直接用于基于音节lattice形式的汉语语音检索存在无法有效区分lattice中包含的正确音节识别候选和错误的识别候选以及不能充分利用lattice中所蕴含的各层级信息的不足,提出了一种基于语音文档邻接音节后验概率矩阵的检索方法。该方法以该矩阵作为文档索引,并计算查询请求被包含在语音文档中的后验概率,并以此来度量查询请求和语音文档间的相关度。后验概率作为可靠的置信测度能够有效区分正确和错误的音节候选,在lattice中后验概率的计算能够充分地利用语音识别结果中的多层级的信息。语音检索实验表明,与基于向量空间模型的检索方法相比,该方法的检索性能有显著提高,是一种适用于汉语语音检索的有效方法。
- 郑铁然韩纪庆
- 关键词:后验概率邻接矩阵
- 一种基于局部学习的鲁棒声学场景识别方法
- 本发明提供一种基于局部学习的鲁棒声学场景识别方法,属于声音信号处理技术领域。本发明首先采集不同声学场景声音信号,进行频域特征提取;并对提取的特征数据预处理;然后对归一化后的数据进行均值平移、使用mixup方法进行数据扩充...
- 韩纪庆杨皓郑贵滨郑铁然
- 文献传递
- 基于约束的结构化稀疏注意力机制的端到端语音识别方法及存储介质
- 基于约束的结构化稀疏注意力机制的端到端语音识别方法及存储介质,属于语音识别技术领域。本发明是为了解决现有的基于Softmax注意力机制的语音识别方法解码过程中存在大量预测无关信息而导致严重干扰解码器识别过程的问题。本发明...
- 韩纪庆薛嘉宾郑贵滨郑铁然
- 基于词片的语言模型及在汉语语音检索中的应用被引量:7
- 2009年
- 在汉语语音检索研究中,为充分利用汉语中音节相互搭配的语言学知识,提出了一种新的汉语语言模型构造基元——"词片"(word fragment),研究了最佳词片选择算法。汉语语音识别实验和语音检索实验表明,采用基于词片的语音模型后,音节正确率有所提高,并取得了更好的语音检索性能。
- 郑铁然韩纪庆李海洋
- 关键词:语言模型互信息
- 基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法
- 基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法,属于建模方法领域。传统的注意力模型存在识别性能较差,注意力尺度单一等问题。一种基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法,采用深度置信网络提取瓶颈特...
- 韩纪庆唐海桃郑铁然郑贵滨
- 文献传递
- 基于音素模型的语音关键词检测系统
- 传统的关键词检测(Keyword spotting, KWS)系统一般基于离线垃圾模型,垃圾模型的设计和训练的难度较大且依赖于具体的关键词表,难以应用到实际系统中。本文提出的基于音素模型的语音关键词检测系统,不需要设计和...
- 陈玉平韩纪庆郑铁然
- 关键词:语音识别关键词误警率
- 文献传递