您的位置: 专家智库 > >

林晓燕

作品数:3 被引量:4H指数:1
供职机构:北京大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文
  • 1篇专利

领域

  • 2篇自动化与计算...

主题

  • 3篇文档
  • 2篇电子文档
  • 1篇排版
  • 1篇中文
  • 1篇中文文档
  • 1篇文本检索
  • 1篇逻辑结构
  • 1篇结构描述文件
  • 1篇版式
  • 1篇PDF文档
  • 1篇查询
  • 1篇查询条件

机构

  • 3篇北京大学

作者

  • 3篇林晓燕
  • 2篇高良才
  • 2篇汤帜
  • 1篇邱勤

传媒

  • 1篇北京大学学报...

年份

  • 2篇2014
  • 1篇2012
3 条 记 录,以下是 1-3
排序方式:
中文电子文档的数学公式定位研究被引量:4
2014年
区别于传统基于图像和西文文档的公式定位方法,针对中文电子文档的特点,提出一种基于机器学习和规则相结合的独立公式和内嵌公式的定位方法。设计了适合中文文档的页面分行策略和词块划分规则;选择适合中文文档的公式特征和机器学习算法;针对公式定位中的过分割问题,提出行合并与词块合并等后处理手段。实验结果表明,该方法可以有效地从中文电子文档中自动定位公式区域。此外,构建了公开可用的中文数据集,以促进不同数学公式定位方法间的相互比较及性能评估。
林晓燕高良才汤帜
关键词:电子文档中文文档
PDF文档的数学公式识别与检索研究
数学公式是教育、科技类文档的重要组成部分,也是科学技术交流的重要语言。目前互联网上积累了海量的包含数学公式的文档资源,如何识别及检索文档中的公式成为很多领域中的关键问题。在移动阅读及数字出版等领域,为了在不同设备和环境中...
林晓燕
关键词:电子文档文本检索
一种公式查询条件的输入方法与装置
本发明公布了一种公式查询条件的输入方法和装置。所述方法包括:用户通过截取屏幕区域的方式,选定当前文档的数字内容中需要检索的公式区域;如果当前文档为版式文档,则进行版式文档符号识别;否则,进行图像文档符号识别;根据公式符号...
林晓燕高良才汤帜邱勤
文献传递
共1页<1>
聚类工具0