刘建
- 作品数:42 被引量:72H指数:5
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家科技支撑计划国家自然科学基金新疆维吾尔自治区重大科技专项更多>>
- 相关领域:自动化与计算机技术电子电信理学艺术更多>>
- 基于CSS的网页分割算法被引量:6
- 2008年
- 在页面变换,信息抽取,信息过滤等应用中,首先需要将原始页面分割成为若干合适的信息块以便于后续的处理。本文提出了一种基于CSS的网页分割算法,通过对网页进行解析和布局处理,提取出其中的CSS信息,并且使用重复模式检测和聚类的方法对生成的CSS树进行分割。试验证明该方法能够有效地分割网页,并且不依赖于特定的浏览器,适合嵌入式系统使用。
- 孙晓辉刘建王劲林陈晓
- 关键词:网页分割HTMLCSS聚类信息块
- 一种基于数字信号处理的语音变声方法
- 本发明公开了一种基于数字信号处理的语音变声方法,包括步骤(1)选取需要变声的原始语音信号;(2)得到原始语音信号的基音周期长度;(3)根据基音周期长度定位整个原始语音信号的每一个基音周期的位置;(4)在原始语音信号中的基...
- 李明刘建汪俊杰庹凌云颜永红孙宝海
- 文献传递
- 一种便携式数字移动通讯设备及其语音控制方法和系统
- 本发明公开一种具有语音操作系统的便携式数字移动通讯设备及语音操作控制方法,在进行语音识别时是利用特征码本对语音的特征矢量序列进行量化编码,而在解码运算中对有效语音特征码字矢量序列的各个码字,是直接从概率表中查到其在搜索路...
- 刘建颜永红庹凌云孙宝海潘接林韩疆苗路广
- 文献传递
- 汉语连续语音识别及连续汉语的声调识别研究
- 该首先给出了一个基于混合连续高斯概率密度函数的HMM不认人连续识别基线系统.通过总结以往研究工作的经验,结合汉语语音学的知识,该文提出了将易误识的短声母和浊声母根据其后续韵母发音类别的不同来细化声母模型的方法,这样总共得...
- 刘建
- 关键词:连续语音识别声调识别基音提取
- 一种基于DHT的Web缓存共享方法被引量:1
- 2008年
- 提出了一种基于DHT技术的Web缓存共享方法。该方法使得企业网络中所有节点能够相互共享浏览器中的本地缓存,从而形成一个高效的、大规模的分布式缓存共享系统。针对Web缓存共享的系统响应迅速的要求提出一种路由步长为O(2)的路由协议,保证Web查询请求最多只经过一次转发就可到达目标节点。性能分析和仿真实验的结果证明其在路由可靠性、命中率、系统响应和缓存代价方面均有满意的效果。
- 刘建孙晓辉倪宏
- 关键词:分布式哈希表WEB缓存命中率
- 基于端到端语音识别的关键词检索技术研究被引量:10
- 2022年
- 近十年来,端到端的语音识别框架发展迅速。区别于传统的基于隐马尔可夫模型的语音识别框架,端到端语音识别拥有众多新特性,而且可以达到相同或更优秀的性能。因此,端到端语音识别吸引了越来越多的关注,已经成为了与传统语音识别并列的第二类主流框架。针对端到端语音识别无法提供关键词检索所需的关键词准确时间起止点与可靠置信度的问题,提出了一种基于端到端语音识别和帧级别对齐的关键词检索框架,并在越南语数据集上进行了实验验证。首先,使用端到端语音识别模型解码待测语句,得到N-最佳假设;然后,从一个与上述识别模型联合训练的音素分类器中获得逐帧音素概率,使用一个基于动态规划的对齐算法为检出的N-最佳假设和逐帧音素概率进行对齐,进而得到N-最佳假设中各个单词的时间起止点和置信度;最后,在N-最佳假设中匹配关键词,并利用时间起止点和置信度合并重复匹配的关键词,得到最终检索结果。在一个越南语自由交谈数据集上的实验表明,提出的关键词检索系统的F1值可以达到77.6%,相对于传统的基于隐马尔可夫模型的关键词检索系统的F1值提升了7.8%,而且可以提供可靠的关键词置信度。
- 杨润延程高峰刘建
- 关键词:语音识别端到端
- 语音识别系统
- 颜永红潘接林张建平赵庆卫刘建付强
- 研究语音识别的目的是要使机器听懂人说话,因此语音识别技术正成为信息技术中人机接口的关键技术。电信级分布式语音识别系统的研发旨在解决人机语音交互的关键技术问题,重点解决在实际应用环境下语音识别技术、音乐检索技术对噪声、信道...
- 关键词:
- 关键词:语音识别音乐检索语音处理平台负载均衡
- 一种嵌入式语音合成方法及系统
- 本发明公开了一种嵌入式语音合成方法及系统,用于手持数字移动通讯设备的操作系统,通过在该操作系统中加载文本分析模块、码字序列生成模块、语音解音码模块输入模块和波形拼接合成模块,可以使输入的文本信息转换成数字语音信号输出。该...
- 刘建汪俊杰颜永红张建平
- 文献传递
- 静音掩蔽和频域分段的音频指纹检索算法
- 2022年
- 为解决背景音及噪音等条件下音频检索识别率低的问题,提出静音掩蔽和频域分段的音频指纹检索算法。首先采用端点检测技术进行语音预处理,将有效语音帧重新组合并利用相邻子带能量差对其提取指纹特征,可有效解决静音帧指纹特征不鲁棒的问题。然后在检索匹配时根据不同音频信号在频域范围内的分布特点,对音频指纹在不同频率区间进行分段和加权,以更精确地计算模板和待检音频之间的相似度。实验表明,与Philips基线算法相比,所提算法在检索速度上提升了一倍,在受背景音等干扰的数据集上,平均准确率与召回率分别绝对提升17.94%和4.66%;与最新Philips算法相比,平均准确率与召回率分别绝对提升13.68%和2.45%。
- 陈树丽张学帅张鹏远刘建
- 关键词:指纹特征相似度音频信号音频检索
- 面向分类的网页主题特征提取被引量:3
- 2010年
- 提出一种基于页面空间特征、视觉特征和内容特征的主题相关性判别方法,通过主题相关度大小量化描述不同内容的重要性,并采用混合加权方法从主题相关节点中提取网页的主题特征。分类实验结果表明,相比传统的FullDoc全文分类,基于此方法提取的主题特征具有更好的分类效果。
- 刘建孙鹏倪宏
- 关键词:网页分类主题特征主题相关性