李艳霞
- 作品数:3 被引量:10H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 相关领域:自动化与计算机技术更多>>
- 受限表格识别系统的研究
- 表格识别是指利用计算机自动辨识印刷在纸或其他介质上的表格文档的过程。在学科上表格识别属于模式识别和人工智能的范畴,在应用上它是一种信息处理系统中高速自动输入方式,也是新一代计算机智能接口的一个重要组成部分。近年来,表格的...
- 李艳霞
- 关键词:OCR模式识别XML连通域
- 文献传递
- 受限表格识别系统的研究被引量:7
- 2006年
- 表格的自动输入、存储、管理已经成为文档智能处理领域的一个重要组成部分。一方面,表格结构复杂多样,使得很难找到一种能良好识别任何表格的通用方法;另一方面,很多领域里使用的表格,需要识别的通常是固定的某些表格单元。因此,设计并实现了一个受限表格识别系统,实验结果表明,该系统提高了表格识别的适应性和正确率。
- 李艳霞孙羽菲张玉志
- 关键词:HOUGH变换二值化连通域
- 基于距离加权的自适应字线分离算法被引量:2
- 2007年
- 提出一种基于距离加权的自适应字线分离算法。应用一定的启发式规则,计算表格线上像素点的权值,将权值与阈值相比较来判断该点是否为字符上的点,其中权值和阈值根据具体表格自动确定。该算法与表格线检测方法无关,且易于实现。实验结果表明,可以很好地处理字线交叠问题,提高了表格识别的正确率。
- 李艳霞孙羽菲张玉志
- 关键词:OCR