韩占校
- 作品数:5 被引量:21H指数:3
- 供职机构:南京大学更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于P2P的分布式主题爬虫系统的设计与实现被引量:8
- 2010年
- 本文详细叙述了一个用于信息检索的基于P2P的分布式爬虫系统的设计和实现过程。系统基于锚文本上下文进行主题相关性判定,采用P2P式的分布式结构,充分利用其动态增加新结点的特性来动态地扩展系统的规模,提高系统的整体吞吐能力,以满足现在和将来的用户对日益增长的大数据量检索需求。实验结果表明,可根据用户给定的主题对网页链接上下文进行主题相关性判定以引导爬虫的爬行路径,能够有效地获取相关主题信息。
- 朱学芳韩占校
- 关键词:网络爬虫对等网络分布式计算信息检索主题爬虫
- 图像检索中的分布式网络爬虫设计与实现
- 随着网络信息的急速增长,传统搜索引擎面临着索引规模、更新速度和个性化需求等多方面挑战。面对这些挑战,适应特定主题和个性化搜索的主题(聚焦)网络爬虫(Topiical Crawler or Focused Crawler)...
- 韩占校
- 关键词:网络爬虫分布式计算图像检索主题爬虫
- 一种图像主题网络爬虫的实现方法研究被引量:3
- 2008年
- 针对一种图像主题爬虫进行了设计研究,采用了基于文字内容的启发式方法,实现了借助图像文件的锚文本及其上下文进行主题相关性判定,能更准确的抓取相关图像资源.还对网页实现了主题相关性判定,以便更有效地引导爬虫的爬行路经.经实验证明,本系统可起到一定的优化效果,为实现定向主题的图像信息采集奠定了良好的基础.
- 朱学芳韩占校
- 关键词:网络爬虫JXTA主题爬虫
- LOD算法在3D地表模拟中的应用研究被引量:10
- 2009年
- 在大型可视化系统中需要对3D场景进行简化以获得理想的视觉效果和处理速度,层次细节技术是其中较为有效的算法之一,它能在保持较好的视觉效果的同时,减少数据量,提高系统的运行速度。通过介绍一个三维仿真系统中地表的生成过程,描述了层次细节技术中四叉树算法的实现方法,分析和验证了它的简化效果。
- 曾维韩占校朱学芳
- 关键词:四叉树
- 一种图像主题网络爬虫的实现方法研究
- 针对一种图像主题爬虫进行了设计研究,采用了基于文字内容的启发式方法,实现了借助图像文件的锚文本及其上下文进行主题相关性判定,能更准确的抓取相关图像资源.还对网页实现了主题相关性判定,以便更有效地引导爬虫的爬行路经.经实验...
- 朱学芳韩占校
- 关键词:网络爬虫JXTA
- 文献传递