熊亮
- 作品数:4 被引量:10H指数:2
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家重点基础研究发展计划中国科学院声学研究所知识创新工程项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 汉语语句核心动词的自动获取研究
- 2007年
- 语句核心动词的自动获取是以动词为中心的汉语语句分析中的重要组成部分。依据概念层次网络理论,在字词概念符号的基础上获取候选动词集合,根据动词的上下文语言环境对动词进行排除和分类处理,对可能作为语句核心动词的动词集合按照作语句核心结构的可能性大小排队,并验证其正确性。实验结果表明,在从真实语料切分得到的3121个语句中,经过排队处理后前三个动词作为语句核心动词的正确率达到了83%。错误分析表明进一步完善知识库及排除排队规则,还可以提高自动获取语句核心动词的正确率。
- 韦向峰熊亮张全
- 关键词:概念层次网络动词
- 汉语语句形式结构到语义结构的理解自明度被引量:1
- 2006年
- 计算机理解语句的方法之一是从形式结构出发得到语义结构。本文从计算机的角度给出了语句形式结构的表示方法,基于概念层次网络理论说明了语句语义结构的描述单位,介绍了从语句形式结构得到语句语义结构的分析方法。用理解自明度来反映分析结果的可靠性,并给出了描述分析过程中各子过程的理解自明度的计算公式。理解自明度是衡量系统分析性能的一个重要指标,也有助于系统解模糊能力的改进和提高。
- 韦向峰张全熊亮
- 关键词:语义结构
- 基于概念树的文本自动分类系统的研究与实现被引量:7
- 2005年
- 该文分类是信息处理的重要研究方向,现在应用较多的都是基于统计的分类系统,本文介绍了一种新型的文本分类理念,通过概念符号化,使用数字化的概念而非词汇来组成特征项,能最大限度地保留文本信息,且不需要训练语料,能灵活适应不同的分类体系。接下来详细描述了领域特征信息提取的4个步骤,以及分类体系的选取与设计。最后给出了实验的测试数据,并对影响性能的一些关键因素进行了分析,指出了进一步提高分类性能的途径。
- 熊亮
- 关键词:文本分类概念树概念层次网络
- 一种基于语义分析的汉语语音识别纠错方法被引量:2
- 2006年
- 汉语语音识别的研究越来越重视与语言处理的结合,语音识别已经不是单纯的语音信号处理。N-gram语言模型应用到语音识别系统中,大大增强了系统的正确率和稳定性,但它也有其自身的局限性,使得语音识别出现许多语法和语义的错误结果。本文分析了语音识别产生语音和文字方面的错误的原因和类型,在概念层次网络语言模型的基础上提出了一种基于语句语义分析和混淆音矩阵的语音识别纠错方法。通过三个发音人、5万字的声音语料和216句实验语句的纠错测试,本文的纠错系统在纠正语义搭配型错误方面有比较好的表现,可克服N-gram语言模型带来的一些缺陷。本文提出的纠错方法还可以融合到语音识别系统中,以便更好地为语音识别的纠错处理服务。
- 韦向峰张全熊亮
- 关键词:语音识别纠错语义分析语言模型概念层次网络