您的位置: 专家智库 > >

李骏

作品数:1 被引量:18H指数:1
供职机构:中国人民解放军海军指挥学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇定制
  • 1篇信息获取
  • 1篇用户
  • 1篇用户定制
  • 1篇爬虫
  • 1篇主题网络
  • 1篇主题网络爬虫
  • 1篇网络
  • 1篇网络爬虫
  • 1篇PAGERA...
  • 1篇大数据

机构

  • 1篇中国人民解放...

作者

  • 1篇薛丽敏
  • 1篇吴琦
  • 1篇李骏

传媒

  • 1篇信息网络安全

年份

  • 1篇2017
1 条 记 录,以下是 1-1
排序方式:
面向专用信息获取的用户定制主题网络爬虫技术研究被引量:18
2017年
进入大数据时代,互联网已成为各行各业进行信息采集的重要阵地。面对爆炸式增长的网络信息资源,如何快速高效地筛选出所需的信息成为亟需解决的现实难题。在互联网海量数据和专用信息采集人员之间构建一个满足特定需求的信息筛选机制,可以大幅度提高专用信息获取工作效率。主题网络爬虫是所有互联网信息获取手段必须具备的首要环节,为了提高专用信息采集的准确性,文章进行了面向公开网络的用户定制主题网络爬虫技术研究。针对大数据时代信息筛选困难的问题,文章通过将用户的兴趣偏好融入到主题网络爬虫的抓取过程中,有效提高了信息筛选力度,并通过实验验证了文中方法能够提高查准率。
薛丽敏吴琦李骏
关键词:大数据主题网络爬虫PAGERANK算法用户定制
共1页<1>
聚类工具0