您的位置: 专家智库 > >

甘肃省应用技术研究与开发专项计划项目(2007GS05285)

作品数:2 被引量:5H指数:2
相关作者:王权施韶亭更多>>
相关机构:甘肃省科学技术情报研究所更多>>
发文基金:甘肃省应用技术研究与开发专项计划项目甘肃省中青年科技研究基金甘肃省科技基础条件平台建设计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇信息抽取
  • 1篇跨库检索
  • 1篇基于WEB
  • 1篇WEB信息
  • 1篇WEB信息抽...
  • 1篇抽取
  • 1篇CURL

机构

  • 2篇甘肃省科学技...

作者

  • 2篇王权
  • 1篇施韶亭

传媒

  • 1篇计算机工程
  • 1篇甘肃科技

年份

  • 1篇2009
  • 1篇2008
2 条 记 录,以下是 1-2
排序方式:
基于Web过程模拟的动态Web信息获取被引量:2
2008年
介绍了分析相关Web页面的方法和经验,实现了自动提交HTML表单获得所需页面。采用性能优异的Web信息获取组件CURL,对大量科技文献网站的网页进行信息获取,实验表明CURL具有优异的处理速度,并成功应用到甘肃省科技文献共享平台的统一检索系统中。
王权
关键词:CURL
基于子树广度的Web信息抽取被引量:3
2009年
提出一种新的网页信息抽取方法,基于子树的广度可不加区分地对不同科技文献网站的页面信息进行自动抽取。对大量科技文献网站进行信息抽取实验,已应用到甘肃省科技文献共享平台。实验结果证明,该方法能不依赖科技文献网页的来源而自动地抽取相关信息,并能保证较高的数据抽取回召率和查准率。
王权施韶亭
关键词:信息抽取跨库检索
共1页<1>
聚类工具0