李锦宇 作品数:17 被引量:67 H指数:5 供职机构: 中国科学技术大学信息科学技术学院电子工程与信息科学系 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 更多>> 相关领域: 电子电信 自动化与计算机技术 机械工程 更多>>
可编程低比特率语音编解码器的设计与实现 低速率语音压缩编码技术的实际应用,关键是编码算法的高性能价格比地实时实现。本文将介绍一个基于高速DSP芯片技术的低比特率语音编解码器。该编解码器具有可编程性,能实时实现大部分低比特率语音编解码算法的能力。同时具有较高的性... 戴礼荣 李鹏怀 王仁华 李锦宇 宋彦关键词:DSP 可编程性 文献传递 H/PC语音压缩与重放的实现 2001年 提出了一种适合于纯软件 H/ PC语音压缩与重放的高音质、低复杂度的 5kbps语音编码器—— PS- ACELP( pre- search algebraic- code- excited linear- prediction) .这个编码器的语音质量与 ITU- T的 G.72 3.1的 5.3kbps编码器的语音质量相当 ,算法复杂度约为 G.72 3.1的三分之一 ,约 7MIPS.详细分析了所提出算法取得低运算复杂度的原因和过程 .由于具有高音质、低复杂度、低码速率的特点 ,PS- ACELP算法可以广泛地应用于纯软件实现的语音压缩与重放、Voice mail、Internet 李锦宇 王仁华关键词:低复杂度 语音压缩 语音编码器 语音通信 H.324系统的语音部分G.723.1协议的实现 G.723.1协议是一个双速率语音压缩编解码协议,它有两种编码速率,分别是 5.27Kbps和6.3Kbps,它们都具有极高的语音质量。本文首先介绍了G.723.1协议的内容, 然后着重介绍了G.723.1协议在H.32... 李锦宇 宋彦 王仁华关键词:ADSP2181 接口模块 总线控制器 文献传递 双路G.723.1在ADSP21061上的实时实现 2000年 由于具有高音质和低码速率的特点 ,G.72 3.1被作为 PSTN网上的可视电话的语音通信标准 ,并广泛应用于 IP Phoen等其他语音通信领域。文中详细介绍了在 ADSP2 10 61上实时实现双路G.72 3.1编解码功能的软硬件设计。系统实现的关键难点是双路编解码算法的实时实现 ,因为采用原始的 G.72 3.1算法 ,双路编解码系统无法实时的实现。通过采用作者提出的一个递推算法 ,双路 G.72 3.1编解码算法所需要的计算量最多为 36.9MIPS,从而能够在 ADSP2 10 61上实时实现。递推算法没有造成 G.72 3.1算法数值的任何改变。由于 ADSP2 10 61是一个低价位芯片 ,所以该双路系统具有相当高的性能价格比 ,它已经在 PSTN网上多媒体通信系统和数字语音记录仪上进行了推广应用。 李锦宇 宋彦 王仁华关键词:语音通信 G.723.1 语音信号处理 多路数字语音记录仪 被引量:5 2000年 本文介绍一种多路数字语音记录仪的结构及其关键技术。 戴礼荣 李锦宇 王仁华关键词:DSP 码本搜索 基于双高斯GMM的特征参数规整及其在语音识别中的应用 被引量:9 2006年 对特征参数概率分布的实验分析表明,在有噪声影响的情况下,特征参数通常呈现双峰分布.据此,本文提出了一种新的,基于双高斯的高斯混合模型(Gaussian mixture model,GMM)的特征参数归一化方法,以提高语音识别系统的鲁棒性.该方法采用更为细致的双高斯模型来表达特征参数的累积分布函数(CDF),并依据估计得到的CDF进行参数变换将训练和识别时的特征参数的分布都规整为标准高斯分布,从而提高识别正确率.在Aurora 2和Aurora 3数据库上的实验结果表明,本文提出的方法的性能明显好于传统的倒谱均值规整(Cepstral mean normalization,CMN)和倒谱均值方差规整(Cepstral mean and variance normalization,CMVN)方法,而与非参数化方法一直方图均衡特征规整方法的性能基本相当. 刘波 戴礼荣 王仁华 杜俊 李锦宇关键词:语音识别 前端 噪声鲁棒性 直方图均衡 多级基音预测的递推算法 针对自适应码本搜索中的多级基音预测算法计算量大的缺点,本文提出了两个递推算法。采用这两个算法,可以大大的降低多级基音预测的计算量,而对多级基音预测算法本身数值没有任何的改变。 李锦宇 王仁华关键词:递推算法 CM 文献传递 基于预搜索策略的ACELP语音编码算法 被引量:9 2000年 针对ITU-T的G.723.1算法的高复杂度,本文提出了一种基于预搜索策略的语音编码器-PS-ACELP。这个编码器与G.723.1的5.3kbps编码器的码流兼容,语音质量相当。算法复杂度约12MIPS。本文第二部分详细分析了我们算法是如何取得低的运算复杂度的.由于具有高音质、低复杂度、与G.723.1的5.3kbps编码器码流兼容的特点,PS-ACELP算法可以广泛的应用在多通道语音录放、Voicemail、InternetPhone等方面. 李锦宇 王仁华关键词:语音编码 ACELP G.723.1 低速率语音编码器研究 语音信号处理主要包括三个部分:语音识别、语音编码、语音合成.在语音编码这个领域,现在的研究集中在低速率语音编码器方面,该文的目的就是进行低速率语音编码器的研究.该文第一章是语音编码器概述.在第二章中,根据作者近来对语音编... 李锦宇关键词:语音编码 语音信号处理 语音识别 语音合成 文献传递 语音识别中的两级MEL域滤波器组维纳滤波方法 被引量:3 2004年 欧洲电信标准化协会(European Telecommunications Standards Institute,简称ETSI)于2002年10月发布了分布式语音识别的鲁棒性前端标准。该标准参数的鲁棒性远优于MFCC参数。为了能够在低运算资源的设备上实现鲁棒性前端,在ETSI标准的核心两级维纳滤波算法的基础上,我们提出了一种新方法以提高算法效率。我们首先在Mel域滤波器组幅度上构造维纳滤波器,然后对维纳滤波器系数进行平滑。最后,将维纳滤波器直接应用到Mel域滤波器组幅度上。实验表明,新方法在保持ETSI两级维纳滤波算法出色性能的同时,大大地降低了运算量。 刘波 李锦宇 戴礼荣 王仁华关键词:分布式语音识别 鲁棒性 滤波器 维纳滤波