2024年12月14日
星期六
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
杨俊峰
作品数:
5
被引量:26
H指数:1
供职机构:
中国科学院计算机网络信息中心
更多>>
发文基金:
中国科学院计算机网络信息中心主任基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
黎建辉
中国科学院计算机网络信息中心
杨风雷
中国科学院计算机网络信息中心
周园春
中国科学院计算机网络信息中心
崔建业
中国科学院计算机网络信息中心
李晓东
中国科学院计算机网络信息中心
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
4篇
专利
1篇
期刊文章
领域
1篇
自动化与计算...
主题
4篇
网页
4篇
网页信息
2篇
信息标题
2篇
信息技术领域
2篇
页面
2篇
区域信息
2篇
主题
2篇
主题性
2篇
联网
2篇
互联
2篇
互联网信息
2篇
分词
2篇
标题
1篇
代词
1篇
导航
1篇
地理
1篇
地理名词
1篇
元数据
1篇
元数据信息
1篇
正文
机构
5篇
中国科学院
作者
5篇
杨风雷
5篇
黎建辉
5篇
杨俊峰
4篇
周园春
2篇
归文胜
2篇
虞路清
2篇
汪海燕
2篇
李晓东
2篇
崔建业
传媒
1篇
计算机应用研...
年份
1篇
2017
1篇
2016
1篇
2014
2篇
2013
共
5
条 记 录,以下是 1-5
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种及时高效的互联网信息爬取方法
本发明公开了一种及时高效的互联网信息爬取方法,属于信息技术领域。本方法为:1)设定种子地址,爬取保存网页信息并确定导航页面;2)对每一导航页面进行多次爬取,并对爬取的网页进行分析标注;4)建立每一网站的主题判断模型和导航...
杨风雷
黎建辉
杨俊峰
虞路清
周园春
文献传递
一种网页信息相关地域的识别方法
本发明公开了一种网页信息相关地域的识别方法。本方法为:1)建立一区域信息本体,2)提取所爬取的网页信息的元数据信息以及正文内容,并对提取的信息标题和正文内容进行分词;3)对词语中表示处所的地名代词进行解析,判断地名代词与...
杨风雷
黎建辉
崔建业
李晓东
周园春
归文胜
汪海燕
杨俊峰
文献传递
一种及时高效的互联网信息爬取方法
本发明公开了一种及时高效的互联网信息爬取方法,属于信息技术领域。本方法为:1)设定种子地址,爬取保存网页信息并确定导航页面;2)对每一导航页面进行多次爬取,并对爬取的网页进行分析标注;4)建立每一网站的主题判断模型和导航...
杨风雷
黎建辉
杨俊峰
虞路清
周园春
文献传递
一种网页信息相关地域的识别方法
本发明公开了一种网页信息相关地域的识别方法。本方法为:1)建立一区域信息本体,2)提取所爬取的网页信息的元数据信息以及正文内容,并对提取的信息标题和正文内容进行分词;3)对词语中表示处所的地名代词进行解析,判断地名代词与...
杨风雷
黎建辉
崔建业
李晓东
周园春
归文胜
汪海燕
杨俊峰
文献传递
深层网站Ajax页面数据采集研究综述
被引量:26
2013年
如果能够提高网络爬虫采集Ajax网页数据的能力,必然会提高搜索引擎的覆盖率和准确率。因此,深层网站Ajax页面数据采集成为当前网络爬虫技术研究的热点之一。从深层网站Ajax页面数据采集的研究目标、近年来国内外采取的研究方法和取得的成果(研究领域、采集流程、支撑技术)、未来的研究方向三个方面进行了综述。
杨俊峰
黎建辉
杨风雷
关键词:
AJAX
WEB2
数据采集
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张