肖熙
- 作品数:53 被引量:110H指数:5
- 供职机构:清华大学信息科学技术学院电子工程系更多>>
- 发文基金:国家高技术研究发展计划中国博士后科学基金国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术语言文字生物学更多>>
- 传声器阵列语音数据采集系统的设计与实现被引量:2
- 2008年
- 介绍了一种传声器阵列语音数据采集系统的软硬件设计方案,该系统采用USB2.0接口实时传输采集到的多通道语音数据,系统具有使用方便、容易扩展等特点。
- 陈晓峰肖熙
- 关键词:传声器阵列USB2.0
- 资源受限系统中的汉语声学模型研究
- 本文提出了可应用于资源受限系统的汉语声学模型。应用该模型,可以大大降低存储空间,在保证识别率基本不变的前提下,减少了识别时间。在550个命令词组成的词表的实验室环境的识别任务下,系统的识别率为97%,相对基线系统下降0....
- 张弛吴及肖熙
- 关键词:声学模型
- 文献传递
- 一个实用的麦克风阵列声源定位系统
- 声源定位是麦克风阵列系统的应用方向之一,本文给出了一个实用的麦克风阵列声源定位系统的具体实现。系统采用基于时延估计的方法来估计声源位置,这类方法分两步进行:第一步是获得麦克风对的TDE,第二步是根据TDE和麦克风的位置获...
- 张成锁肖熙
- 关键词:麦克风阵列语音信号
- 文献传递
- 基于三音子DDBHMM的连续语音识别
- 当前连续语音识别中使用的主流技术是HMM(Hidden MarkovModel),但是它在非特定人大词汇量连续语音识别中的表现不能令人满意,其根本原因在于HMM本身的若干性质与语音信号的发音情况不符合。本文首先分析了传统...
- 游展陈晓峰肖熙
- 关键词:DDBHMM三音子
- 文献传递
- 应用人耳听觉掩蔽特性的语音识别特征
- 本文将人耳的听觉掩蔽特性应用于中文连续语音识别系统之中.在特征提取阶段,根据由听觉掩蔽特性计算得到的掩蔽阈值,动态调整语音帧的功率谱,在此基础之上计算出MFCC做为本帧信号的语音特征用于语音识别.实验结果表明:该方法不仅...
- 李崇王侠肖熙
- 关键词:语音识别掩蔽阈值
- 文献传递
- 汉语语音正弦模型特征分析和听觉辨识被引量:3
- 2011年
- 为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图。该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具。在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主要参数的条件下进行了听觉的辨识实验,测试了基频和共振峰等参数的微小变化对听觉的影响,得到了汉语单韵母的听觉混淆矩阵。
- 张毅楠肖熙
- 关键词:正弦模型语谱图语音识别特征提取
- 非凸段长分布隐含Markov模型的搜索算法
- 2005年
- 基于段长分布的隐含Markov模型(DDBHMM)可解决经典隐含Markov模型(HMM)的状态段长指数分布的问题,实现了基于凸性假设的搜索。为解决非齐次模型的搜索算法问题,提出采用混合Gauss分布来拟合非凸段长分布,用子状态拆分的方法来实现非凸段长分布DDBHMM识别算法。在音乐信号识别上的实验表明:该方法在召回率提高1.1%的情况下,使准确率提高约10%。该方法实现了非凸段长分布HMM的识别算法,并且对于其他非凸段长信号具有推广价值。
- 吴及肖熙许琳王作英
- 关键词:语音识别隐含马尔可夫模型
- 一种新的检测语音端点及基音的概率模型及方法
- 本文提出了一种基于语音幅度概率模型与隐含马尔科夫模型(HMM)的语音时域分析方法,它同时完成对语音端点的检测、清浊音的判断与基音频率计算。实验表明这种算法在10dB以上信噪比的条件下可以得到准确的基音频率和端点位置。
- 胡波肖熙
- 关键词:端点检测基音检测HMM
- 文献传递
- 检测语音端点及基音的概率模型及方法被引量:4
- 2013年
- 在传统的语音识别系统中,语音端点检测和基音提取是2个分开的步骤。将2个步骤合二为一将有助于提高误别准确性、降低系统复杂度。该文使用了一种语音时域分析方法,它使用概率模型描述语音幅度分布规律,并使用隐Markov模型(hidden Markov model,HMM)描述语音中的状态转换。使用新方法可以同时完成对语音端点的检测、清浊音的判断与基音频率计算。实验表明:这种算法在10dB以上信噪比的条件下可以得到准确的基音频率和端点位置。
- 胡波肖熙
- 关键词:端点检测基音提取
- 段长信息在连续语音识别中的应用研究被引量:9
- 2000年
- 基于段长分布的隐含马尔可夫模型(DDBHMM)有效地解决了经典HMM的缺陷.本文以DDBHMM模型为基础,详细研究了如何在连续语音识别中有效地利用段长信息。文中首先介绍了段长分布的统计方法,然后按照不同的说话速度对数据文件进行了分类,据此进行的识别实验表明,段长信息对于速度慢的文件效果最好,速度中等的次之,速度快的效果较小.作者认为,段长信息最大的作用在于能够得到更加精确的音节和状态分割点,并因而提高识别效果.同时,通过段长信息的有效利用,还能够提高识别系统对于说话速度的稳健性、作者又进行了细化研究,提出了利用分类段长和规整化的段长的研究方法,发现两者均可使识别效果有进一步的提高.为了研究如何利用段长之间的相关性,文中还提出了段长的Bigram的方法,并对之作了分析.最后,本文研究了采用后处理方法利用段长信息的效果,进一步说明了只有基于DDBHMM,在识别过程中同步利用段长信息,才能得到卓有成效的性能提高。
- 赵庆卫肖熙王作英
- 关键词:连续语音识别