丁鹏
- 作品数:14 被引量:11H指数:2
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术矿业工程文化科学更多>>
- 一种语音识别结果纠错方法
- 本发明涉及语音识别技术领域,特别是一种语音识别结果纠错方法。利用可纠错知识库对识别结果进行纠错的方法,该方法的最基本的特征,一是以语料库中的连续语言片段作为纠错模版,利用语料库建立纠错模版库;二是对纠错模版库建立索引,使...
- 王晓瑞江杰王士进丁鹏徐波
- 文献传递
- 语音识别准确率与检索性能的关联性研究
- 对海量语音进行基于内容的检索需要语音识别技术和检索技术的结合。本文通过调节语言模型的途径研究在不同识别率的语音识别文本上进行关键词检索的差异,由此研究语音识别性能和检索性能之间的关联性。通过对114小时语音数据的实验表明...
- 周梁高鹏丁鹏徐波
- 关键词:语音识别关键词检索查全率查准率
- 文献传递
- 语音识别准确率与检索性能的关联性研究
- 对海量语音进行基于内容的检索需要语音识别技术和检索技术的结合.本文通过调节语言模型的途径研究在不同识别率的语音识别文本上进行.
- 周梁高鹏丁鹏徐波
- 关键词:语音识别关键词检索查全率查准率语言模型
- 文献传递
- 语音识别准确率与检索性能的关联性研究被引量:5
- 2006年
- 对海量语音进行基于内容的检索需要语音识别技术和检索技术的结合。本文通过调节语言模型的途径研究在不同识别率的语音识别文本上进行关键词检索的差异,由此研究语音识别性能和检索性能之间的关联性。通过对114小时语音数据的实验表明:语音识别性能与检索性能有一定的相关性,同时也说明改进检索的方法可以消除一部分由于语音识别所带来的误差。研究结果为进一步针对性地改进识别引擎、语音识别输出的表示和相应的快速检索方法提供了基础。
- 周梁高鹏丁鹏徐波
- 关键词:计算机应用中文信息处理语音识别关键词检索查全率查准率
- 一个面向广播语音识别的语言模型自适应框架
- 2007年
- 语言模型自适应的目的是减小模型与识别任务之间的语言差异。这些差异包括词典差异、风格和内容差异以及模型的概率分布差异。本文提出一种新的非迭代的中文新词提取方法和一种新的开放式词典的中文语言模型。基于这些技术,本文提出一个面向广播语音识别的语言模型自适应框架,该框架联合了以下技术:一种新的非迭代的新词提取方法,一种新的中文开放式词典语言模型,一种基于困惑度(PPL)的背景语料筛选方法和一个N-gram概率分布自适应模块。另外,本文还专门分析了在语言模型自适应过程中命名实体词的识别情况。实验表明,通过使用该框架,误识率相对下降了10%,实体词识别准确率提高了4%。
- 王晓瑞丁鹏梁家恩徐波
- 关键词:计算机应用中文信息处理
- 基于决策树的海量语音数据处理与建模
- 丁鹏徐波
- 基于决策树的海量语音数据处理与建模
- 本文提出了一种基于决策树的海量语音数据处理与建模方法,这种方法可以有效地结合语境与非语境信息,并利用决策树方法本身对模型的预测与鲁棒估计特性,对海量语音训练数据进行分类与建模.这种方法包括两部分:利用非语境特征扩展决策树...
- 丁鹏徐波
- 文献传递
- 一种基于语音关键词识别的广播电视内容监测系统被引量:4
- 2009年
- 随着我国广播电视事业的发展,广播电视内容监测越来越重要,传统人工方式的内容监测技术已不能适应新时期的要求,迫切要求引入基于计算机自动音视频处理的内容监测技术。本文介绍了一个先进的基于语音关键词识别的广播电视内容监测系统,从该系统投入运行情况来看,系统使用后监测工作效率提高了60~80倍,为内容监测业务提供了有效解决方案。
- 陈彪丁鹏徐波
- 关键词:广播电视语音关键词识别
- 基于语音数据异质性信息处理的声学建模研究
- 语音信号中包含丰富的信息,除文本内容外还包括很多与语音识别任务无关的部分.这些信息的典型来源包括说话人性别、年龄、情绪、说话风格、背景噪声、传输信道等因素,在该文中被统一定义为异质性信息.对语音数据异质性信息的处理正日趋...
- 丁鹏
- 关键词:声学模型隐马尔可夫模型
- 文献传递
- 综合非语境因素的语音数据分类与声学建模研究
- 2004年
- 分别采用基于数据聚类和基于先验知识的两种研究方法,深入探讨了性别、口音、语速、信道等非语境因素对语音数据分类与建模的影响。为了综合考虑语境、非语境因素在统一框架下建模的问题,采用非语境因素扩展决策树方法。而对于这种方法生成的多套非语境因素相关的高精度声学模型,提出一种依据最大似然准则,动态组合生成测试人相关声学模型的算法。这种方法可以使系统相对误识率平均降低8%-10%。实验结果说明为非语境因素分类建模可以提高声学模型的建模能力,而且模型组合算法可以有效解决统一建模所带来的模型选择问题。
- 丁鹏徐波
- 关键词:数据聚类声学建模最大似然准则误识率语音识别系统