公共文化服务平台

基于谐波结构信息的自动音乐标注方法被引量：4: 2006年; 根据同类乐器音色相似的特点,提出了一种基于谐波结构信息的自动音乐标注方法·该方法事先提取一类乐器中某一件乐器的谐波结构信息·根据输入信号选择合适的不谐和系数、频率误差系数,结合谐波结构信息构造同类未知乐器的响度谱,然后采用截断完全最小二乘法实现对同类未知乐器音乐的标注·对钢琴音乐的实验证明,该方法不仅能对未知乐器的音乐进行标注,取得较好的性能,还可辨别音符的响度强弱·; 郑贵滨韩纪庆; 关键词：响度

基于音节Lattice的汉语语音检索技术及其索引去冗余方法被引量：8: 2008年; 针对网络中越来越多的语音数据,人们迫切地需要基于语义内容的快速、准确的语音检索技术。本文在基于音节Lattice的汉语语音检索研究中,针对传统的向量空间模型检索方法的不足,提出了一种基于词检出实现的语音检索方法。并针对Lattice索引存在的信息冗余问题,提出了一种基于音节后验概率直方图的索引去冗余方法。实验结果表明,本文的检索方法在性能上明显优于向量空间模型方法;而提出的索引去冗余方法达到了大规模缩减索引尺寸加快检索速度的目的。; 郑铁然韩纪庆; 关键词：LATTICE 汉语语音索引音节向量空间模型

基于限制模型规模和声学置信度的关键词检出方法: 2008年; 在基于令牌传递算法的关键词检出技术中,为改进实时性,本文首先从限制模型规模的角度,提出了限制上下文相关的词内相关音素模型。针对误识率高的问题,提出了基于声学置信度的关键词确认方法,并实现了多次解码机制,提高了识别性能。其次,从改进解码算法的角度,研究了剪枝和控制最大激活模型数两种策略对识别性能的影响,并结合确认机制进行关键词检出,获得了满意的结果。; 郑铁然张战韩纪庆; 关键词：关键词检出置信度令牌环

基于K-L散度的最大后验弧主导的混淆网络生成算法被引量：6: 2008年; 为快速生成高质量混淆网络,该文提出一种最大后验弧主导的快速生成算法。它只需遍历一遍Lattice,具有线性时间复杂度。采用K-L散度(Kullback-Leibler Divergence,KLD)来度量弧标号之间的发音相似性,改善了混淆网络生成中弧对齐的准确性。实验结果显示,所提算法在生成速度上和Xue的快速算法是可比的,而生成质量更好。通过采用KLD作为弧标号相似性测度,生成混淆网络的质量得到了进一步提高。; 王欢良韩纪庆郑铁然李海峰; 关键词：语音识别混淆网络 LATTICE

基于后验概率的汉语语音检索方法研究被引量：3: 2009年; 针对经典的向量空间检索模型直接用于基于音节lattice形式的汉语语音检索存在无法有效区分lattice中包含的正确音节识别候选和错误的识别候选以及不能充分利用lattice中所蕴含的各层级信息的不足,提出了一种基于语音文档邻接音节后验概率矩阵的检索方法。该方法以该矩阵作为文档索引,并计算查询请求被包含在语音文档中的后验概率,并以此来度量查询请求和语音文档间的相关度。后验概率作为可靠的置信测度能够有效区分正确和错误的音节候选,在lattice中后验概率的计算能够充分地利用语音识别结果中的多层级的信息。语音检索实验表明,与基于向量空间模型的检索方法相比,该方法的检索性能有显著提高,是一种适用于汉语语音检索的有效方法。; 郑铁然韩纪庆; 关键词：后验概率邻接矩阵

基于词片的语言模型及在汉语语音检索中的应用被引量：8: 2009年; 在汉语语音检索研究中,为充分利用汉语中音节相互搭配的语言学知识,提出了一种新的汉语语言模型构造基元——"词片"(word fragment),研究了最佳词片选择算法。汉语语音识别实验和语音检索实验表明,采用基于词片的语音模型后,音节正确率有所提高,并取得了更好的语音检索性能。; 郑铁然韩纪庆李海洋; 关键词：语言模型互信息

基于特征似然度加权和维数缩减的Robust语音端点检测被引量：7: 2007年; 传统的语音端点检测方法在低信噪比环境下可靠性会急剧下降。本文提出了两种特征处理方法:特征的似然度加权和基于散度的维数缩减,来提高噪声下端点检测的性能。通过加权增加动态特征在似然度计算中的比重,可以提高端点检测的噪声Robustness。缩减散度值较小的特征维,对检测精度只有很小的影响,但可以提高检测效率。似然度加权对维数缩减之后的特征同样有效。在Aurora2数据库上的实验结果显示,在干净数据训练的检测模型下,似然度加权可以显著提高噪声下的端点检测性能。对维数缩减后的特征进行似然度加权,获得了与原始特征似然度加权相当的检测性能。这说明本文提出的方法是有效的。; 王欢良韩纪庆李海峰; 关键词：语音端点检测加权和似然度维数

基于非负矩阵分解的中文文本主题分类被引量：5: 2009年; 提出基于非负矩阵分解(NMF)的中文文本主题分类方法,应用NMF算法分解词-文本矩阵获取词之间的相关性,有效地解决同义词、多义词的影响。实验结果表明,与基于奇异值分解的潜在语义索引方法相比,该方法计算速度快、占用存储空间较少。在潜在语义数据降低较大的情况下,NMF方法具有更好的分类精度。; 张磊冯晓森项学智; 关键词：主题分类非负矩阵分解潜在语义索引

基于声调建模的带噪汉语数字串语音识别被引量：3: 2007年; 尝试利用声调信息来改善噪声下汉语数字串语音识别性能。为解决声调特征不连续问题,提出采用基于多空间概率分布的隐马尔可夫模型进行声调建模。简要分析噪声对声调特征提取的影响,论证了在带噪数字串语音识别中利用声调信息的可行性。实验结果显示,与不采用声调信息的方法相比,在5 dB到20 dB的测试数据上,所提方法可使错误率平均相对下降17.2%。这说明声调信息及所提建模方法对于改善带噪汉语数字串语音识别性能是有效的。; 王欢良钱瑶F.K.Soong韩纪庆; 关键词：声调特征语音识别建模方法隐马尔可夫模型概率分布

SVM with discriminative dynamic time alignment被引量：1: 2007年; In the past several years, support vector machines (SVM) have achieved a huge success in many fields, especially in pattern recognition. But the standard SVM cannot deal with length-variable vectors, which is one severe obstacle for its applications to some important areas, such as speech recognition and part-of-speech tagging. The paper proposed a novel SVM with discriminative dynamic time alignment (DDTA-SVM) to solve this problem. When training DDTA-SVM classifier, according to the category information of the training samples, different time alignment strategies were adopted to manipulate them in the kernel functions, which contributed to great improvement for training speed and generalization capability of the classifier. Since the alignment operator was embedded in kernel functions, the training algorithms of standard SVM were still compatible in DDTA-SVM. In order to increase the reliability of the classification, a new classification algorithm was suggested. The preliminary experimental results on Chinese confusable syllables speech classification task show that DDTA-SVM obtains faster convergence speed and better classification performance than dynamic time alignment kernel SVM (DTAK-SVM). Moreover, DDTA-SVM also gives higher classification precision compared to the conventional HMM. This proves that the proposed method is effective, especially for confusable length-variable pattern classification tasks.; 王欢良韩纪庆李海峰; 关键词：支持向量机计算机技术计算方法编程语言

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(60575030)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家自然科学基金(60575030)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈