您的位置: 专家智库 > >

浙江省科技计划项目(2007C23086)

作品数:2 被引量:8H指数:2
相关作者:林怀忠陈丽君冯明远更多>>
相关机构:浙江大学浙江越秀外国语学院更多>>
发文基金:浙江省科技计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇页面
  • 2篇爬虫
  • 1篇页面聚类
  • 1篇页面刷新
  • 1篇引擎
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇网络
  • 1篇网络爬虫
  • 1篇聚类
  • 1篇WEB
  • 1篇WEB爬虫
  • 1篇DEEP
  • 1篇DEEP_W...

机构

  • 2篇浙江大学
  • 1篇浙江越秀外国...

作者

  • 2篇林怀忠
  • 1篇冯明远
  • 1篇陈丽君

传媒

  • 1篇计算机应用研...
  • 1篇计算机系统应...

年份

  • 2篇2009
2 条 记 录,以下是 1-2
排序方式:
搜索引擎页面刷新策略研究综述被引量:5
2009年
根据判断信息来源的不同,对现有页面刷新策略进行了分类,系统地分析了它们各自的特点,指出了各种策略各自存在的优点与不足。对未来的研究方向进行了展望,给出了若干值得研究的问题。
陈丽君林怀忠
关键词:搜索引擎网络爬虫页面刷新
基于最优查询的多领域deep Web爬虫被引量:3
2009年
Deep Web信息通过在网页搜索接口提交查询词获得。通用搜索引擎使用超链接爬取网页,无法索引deep Web数据。为解决此问题,介绍一种基于最优查询的deep Web爬虫,通过从聚类网页中生成最优查询,自动提交查询,最后索引查询结果。实验表明系统能自动、高效地完成多领域deep Web数据爬取。
冯明远林怀忠
关键词:DEEPWEBDEEPWEB爬虫页面聚类
共1页<1>
聚类工具0