您的位置: 专家智库 > >

杨俊峰

作品数:5 被引量:26H指数:1
供职机构:中国科学院计算机网络信息中心更多>>
发文基金:中国科学院计算机网络信息中心主任基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇专利
  • 1篇期刊文章

领域

  • 1篇自动化与计算...

主题

  • 4篇网页
  • 4篇网页信息
  • 2篇信息标题
  • 2篇信息技术领域
  • 2篇页面
  • 2篇区域信息
  • 2篇主题
  • 2篇主题性
  • 2篇联网
  • 2篇互联
  • 2篇互联网信息
  • 2篇分词
  • 2篇标题
  • 1篇代词
  • 1篇导航
  • 1篇地理
  • 1篇地理名词
  • 1篇元数据
  • 1篇元数据信息
  • 1篇正文

机构

  • 5篇中国科学院

作者

  • 5篇杨风雷
  • 5篇黎建辉
  • 5篇杨俊峰
  • 4篇周园春
  • 2篇归文胜
  • 2篇虞路清
  • 2篇汪海燕
  • 2篇李晓东
  • 2篇崔建业

传媒

  • 1篇计算机应用研...

年份

  • 1篇2017
  • 1篇2016
  • 1篇2014
  • 2篇2013
5 条 记 录,以下是 1-5
排序方式:
一种及时高效的互联网信息爬取方法
本发明公开了一种及时高效的互联网信息爬取方法,属于信息技术领域。本方法为:1)设定种子地址,爬取保存网页信息并确定导航页面;2)对每一导航页面进行多次爬取,并对爬取的网页进行分析标注;4)建立每一网站的主题判断模型和导航...
杨风雷黎建辉杨俊峰虞路清周园春
文献传递
一种网页信息相关地域的识别方法
本发明公开了一种网页信息相关地域的识别方法。本方法为:1)建立一区域信息本体,2)提取所爬取的网页信息的元数据信息以及正文内容,并对提取的信息标题和正文内容进行分词;3)对词语中表示处所的地名代词进行解析,判断地名代词与...
杨风雷黎建辉崔建业李晓东周园春归文胜汪海燕杨俊峰
文献传递
一种及时高效的互联网信息爬取方法
本发明公开了一种及时高效的互联网信息爬取方法,属于信息技术领域。本方法为:1)设定种子地址,爬取保存网页信息并确定导航页面;2)对每一导航页面进行多次爬取,并对爬取的网页进行分析标注;4)建立每一网站的主题判断模型和导航...
杨风雷黎建辉杨俊峰虞路清周园春
文献传递
一种网页信息相关地域的识别方法
本发明公开了一种网页信息相关地域的识别方法。本方法为:1)建立一区域信息本体,2)提取所爬取的网页信息的元数据信息以及正文内容,并对提取的信息标题和正文内容进行分词;3)对词语中表示处所的地名代词进行解析,判断地名代词与...
杨风雷黎建辉崔建业李晓东周园春归文胜汪海燕杨俊峰
文献传递
深层网站Ajax页面数据采集研究综述被引量:26
2013年
如果能够提高网络爬虫采集Ajax网页数据的能力,必然会提高搜索引擎的覆盖率和准确率。因此,深层网站Ajax页面数据采集成为当前网络爬虫技术研究的热点之一。从深层网站Ajax页面数据采集的研究目标、近年来国内外采取的研究方法和取得的成果(研究领域、采集流程、支撑技术)、未来的研究方向三个方面进行了综述。
杨俊峰黎建辉杨风雷
关键词:AJAXWEB2数据采集
共1页<1>
聚类工具0