您的位置: 专家智库 > >

河南省科技攻关计划(2011B510008)

作品数:1 被引量:1H指数:1
相关作者:张贞贞孙全红更多>>
相关机构:华北水利水电学院更多>>
发文基金:河南省科技攻关计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息抽取
  • 1篇信息抽取方法
  • 1篇文档
  • 1篇二叉树
  • 1篇WEB表格
  • 1篇DOM树
  • 1篇HTML文档
  • 1篇表格信息
  • 1篇抽取
  • 1篇抽取方法

机构

  • 1篇华北水利水电...

作者

  • 1篇孙全红
  • 1篇张贞贞

传媒

  • 1篇华北水利水电...

年份

  • 1篇2011
1 条 记 录,以下是 1-1
排序方式:
基于树结构的Web表格信息抽取方法被引量:1
2011年
针对目前国内外多种信息抽取方法中存在不同程度的局限性,提出一种基于DOM树和二叉树结构的Web表格信息抽取方法.该方法提供了以Web表格为信息抽取对象的、支持抽取方式选择的Web表格信息抽取工具.该工具将Html文档解析成DOM树,再将DOM树构建成一棵含有文本信息的二叉树,最后通过遍历二叉树实现对Web表格信息的抽取.
孙全红张贞贞
关键词:表格信息HTML文档DOM树二叉树
共1页<1>
聚类工具0