您的位置: 专家智库 > >

夏莹

作品数:19 被引量:187H指数:8
供职机构:清华大学信息科学技术学院智能技术与系统国家重点实验室更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 16篇期刊文章
  • 2篇会议论文

领域

  • 16篇自动化与计算...
  • 2篇语言文字

主题

  • 12篇汉字识别
  • 8篇手写
  • 4篇汉字
  • 4篇后处理
  • 3篇印刷体
  • 3篇语言
  • 3篇语言学
  • 3篇手写体
  • 2篇印刷体汉字
  • 2篇语料
  • 2篇语料库
  • 2篇语料库语言学
  • 2篇知识
  • 2篇智能型
  • 2篇识别后处理
  • 2篇手写汉字
  • 2篇手写汉字识别
  • 2篇手写体汉字
  • 2篇手写印刷体
  • 2篇文本识别

机构

  • 18篇清华大学
  • 2篇北京市图书馆
  • 2篇科技公司

作者

  • 18篇夏莹
  • 10篇马少平
  • 8篇朱小燕
  • 4篇金奕江
  • 4篇常新功
  • 3篇吴智彪
  • 3篇姜哲
  • 2篇孙茂松
  • 2篇孙承鉴
  • 1篇包塔
  • 1篇江铭虎
  • 1篇胡宇晓
  • 1篇杨泽红

传媒

  • 4篇清华大学学报...
  • 4篇中文信息学报
  • 2篇中文信息
  • 1篇模式识别与人...
  • 1篇计算机学报
  • 1篇现代电信科技
  • 1篇语言文字应用
  • 1篇计算机工程与...
  • 1篇计算机与信息...
  • 1篇863计划智...
  • 1篇全国第二届计...

年份

  • 1篇2002
  • 1篇2001
  • 2篇2000
  • 3篇1998
  • 2篇1997
  • 4篇1996
  • 1篇1995
  • 1篇1993
  • 2篇1990
  • 1篇1989
19 条 记 录,以下是 1-10
排序方式:
用非精确结构匹配法识别手写印刷体汉字被引量:2
1990年
本文为手写印刷体汉字识别提供了一种新的解决方法。在研究过程中,从汉字图象的输入到识别结果的获取,建立了一整套基本完整的识别实验系统。系统选择四边形状特征作为粗分类的基本特征,提出汉字最稳定的结构是笔划段之间相对位置关系的思想。在粗分类时引入集合运算,提高了粗分类的正确率和分类能力,在细分时用快速合并笔划段的方法获取汉字笔划段作为细分特征。最后对于关系结构图的匹配提出了一种新的匹配方法——相共属性关系图启发式匹配,这种方法利用了汉字样本知识,建立具有相关属性的关系图,在其指导下,完成非精确的结构匹配,该系统在386微机上用汇编语言实现,对1千个手写常用汉字识别率达90%以上,速度是每字2秒。
吴智彪夏莹孙承鉴
关键词:汉字识别手写印刷体
用语料库语言学知识指导文本识别研究
常新功夏莹
关键词:语料库计算语言学文本识别汉语
手写印刷体汉字相关属性关系图启发式匹配法被引量:8
1990年
在手写印刷体汉字识别的研究中,汉字的总体结构特征渐渐体现出了它的重要性,人在识字时,也只是掌握了汉字结构的一种抽象描述,只要汉字的结构偏差在一定范围内,人就可以进行非精确匹配,将该字识别出来,我们详细分析了手写印刷体汉字的结构特征,认为手写印刷体汉字最稳定的结构特征是汉字笔划段之间的相对位置关系。
吴智彪夏莹孙承鉴
关键词:手写印刷体汉字识别
基于模糊方向线素特征的手写体汉字识别被引量:69
1997年
方向线素特征在手写体汉字识别中得到了广泛的应用,文中对该特征进行了形式化描述,分析了其存在的不足,在普通方向线素特征的基础上,引入模糊数学思想,提出了汉字的模糊方向线素特征,给出了形式化描述,应用该特征实现了一个非特定人手写体汉字识别系统,经对含有37550个汉字(10套国标一级汉字)的未学习样张的测试,识别率由85.5%提高到89.7%,十选正确率达到98.4%,在同等测试条件下。
马少平夏莹朱小燕
关键词:汉字识别特征抽取手写体汉字方向线素特征
汉字文本识别的自动后处理被引量:6
1997年
在汉字识别率不是很高时,可利用上下文相关信息(词汇及字字相邻出现概率),把一个汉语句子或短语作为一个处理单元,利用词匹配信息修改汉字识别的可信度,再用动态规划方法找到最佳结果。这种基于统计概率和词汇匹配相结合的方法,对脱机手写汉字识别文本进行自动后处理。
夏莹马少平孙茂松朱小燕金奕江常新功
关键词:文本识别手写汉字识别后处理方法正确率基于统计
适合个人通信产品使用的智能型数字输入技术被引量:1
1998年
文章阐述了电子信息产业的发展方向,分析了个人通信产品对汉字输入的需求以及用10个数字快速连续输入汉字的有利条件,提出了在计算机人工智能处理重码技术比较成熟的前提下音、形两种数字码输入方法.
夏莹张金岭
关键词:人工智能汉字编码
用快速合并轮廓线的方法抽取手写印刷体汉字笔画段被引量:2
1989年
本文提出了一种新的抽取汉字笔划段的方法,这种方法避免了细化算法的不利因素,利用汉字近似多角形的特点,对包围汉字图象的轮廓线进行合并处理,从而得到质量较好的汉字笔划段,速度比细化算法有了显著提高。
吴智彪夏莹孙承鉴
关键词:轮廓线
联机手写汉字识别系统接口的智能化被引量:1
1996年
汉字的识别输入的目的是:使用者不需要额外的学习和训练,只要会写会念,就能实现汉字的输入。目前,汉字的识别输入成为中文信息系统实现人机接口智能化的有效途径。
杨泽红夏莹
关键词:汉字识别智能化
计算机语言学方法在中文文字识别后处理中的应用被引量:2
1996年
近年来,脱机手写汉字识别[OCR]研究取得了很大进步,识别率在提高,前十选识别可达95%以上,但第选识别率仍不够高。OCR 的研究者们已看到单纯的单字(Isolatedcharacter)识别的方法对整个文本识别是不够的。
夏莹马少平孙茂松朱小燕金奕江李国华
关键词:汉字识别文字识别汉字处理计算机语言学
利用上下文相关信息的汉字文本识别被引量:10
1996年
为了改善汉字文本识别率,本文提出了一种基于语料库统计概率的后处理方法,该方法利用上下文相关信息,超过词汇。对于汉字文本识别,把具有确定性边界的一个汉字序列(多数情况为一个句子)作为一个处理单元,利用统计获得的字字同现概率,采用动态规划方法,获得了令人满意的效果。
夏莹常新功马少平朱小燕金奕江
关键词:汉字识别语料库语言学
共2页<12>
聚类工具0