您的位置: 专家智库 > >

文献类型

  • 10篇中文专利

主题

  • 4篇用户
  • 4篇爬虫
  • 4篇分布式
  • 2篇独立模块
  • 2篇元数据
  • 2篇网页
  • 2篇网页解析
  • 2篇集群
  • 2篇分布式集群
  • 1篇登录
  • 1篇登录认证
  • 1篇登陆
  • 1篇页面
  • 1篇异构
  • 1篇引擎
  • 1篇用户认证
  • 1篇用户态
  • 1篇用户需要
  • 1篇舆情
  • 1篇舆情分析

机构

  • 10篇浪潮电子信息...

作者

  • 10篇程瑶
  • 1篇张延良
  • 1篇文中领
  • 1篇张在贵
  • 1篇李杰

年份

  • 1篇2018
  • 4篇2015
  • 5篇2014
10 条 记 录,以下是 1-10
排序方式:
一种基于fuse的访问对象存储集群的客户端的实现方法
本发明公开了一种基于fuse的访问对象存储集群的客户端的实现方法,其具体实现过程为:客户端通过linux提供的fuse内核挂载,在客户端挂载的目录下对远端分布式对象存储系统进行访问,上述客户端分为内核模块和用户态守护进程...
李杰程瑶
文献传递
一种元数据集群负载平衡实现方法
本发明公开一种元数据集群负载平衡实现方法,涉及计算机存储技术,在集群文件系统中实现多个元数据服务器,通过定时同步各元数据服务器上元数据负载信息,将元数据负载较大的服务器的负载自动分配给压力小的元数据服务器,进行元数据服务...
张延良张在贵程瑶
文献传递
一种爬虫采集内容结构化的方法
本发明公开了一种爬虫采集内容结构化的方法,适用于爬虫对网页的解析阶段,其适用的体系结构包括:爬虫模块、解析模块和结合模块;其中,爬虫模块实现整个数据采集过程,包含结合模块;解析模块是实现网页解析的独立模块;结合模块用于连...
程瑶
文献传递
一种基于数据库同步的舆情分析系统优化方法
本发明公开了一种基于数据库同步的舆情分析系统优化方法,在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;在采集信息导入舆情分析系统时,在数据同步模块中加入舆情包含词库、舆情排除词库信息...
程瑶刘粉粉陈大雅
文献传递
一种提升元数据集群性能的方法
本发明特别涉及一种提升元数据集群性能的方法。该提升元数据集群性能的方法体系包括导出端、导入端和旁观者三部分,所述导出端负责驱动整个导出过程,所述导入端负责配合导出端完成目录迁移,所述旁观者为待导出目录的副本的拥有者;该方...
程瑶
文献传递
一种爬虫模拟登陆采集的方法
本发明提供一种爬虫模拟登陆采集的方法,其具体实现过程为:设置采集请求模块、身份认证模块、采集下载模块,其中采集请求模块实现对待采集页面发送采集请求;身份认证模块实现待采集网站自动化登录认证;采集下载模块实现对待采集页面进...
程瑶
文献传递
一种快速获知分布式集群节点失效的方法
本发明提供一种快速获知分布式集群节点失效的方法,属于分布式文件系统领域,包括客户端模块、元数据节点、分布式数据存储节点,客户端模块是访问文件系统的入口,主要是负责用户的数据请求;元数据节点负责存储数据的元数据部分;分布式...
程瑶
文献传递
一种异构集群存储自适应数据负载的方法
本发明公开一种异构集群存储自适应数据负载的方法,属于计算机系统存储领域;具体步骤为:①基本的负载的均衡,在系统初建时,根据节点的最大负载能力,将数据分布在集群的各个节点上;②自适应分布式的增量负载的均衡,在系统运行时,实...
陈大雅程瑶刘粉粉
文献传递
高可用、高可扩展、分布式的模块化网络爬虫
本发明公开了一种高可用、高可扩展、分布式的模块化网络爬虫,提出了一种新型网络爬虫体系结构,该体系结构主要包括:资源模块、网页下载模块、网页分解模块以及事件驱动模块,所述资源模块包括控制模块、网页存储模块和通信模块;该新型...
陈大雅程瑶文中领
文献传递
一种爬虫采集内容结构化的方法
本发明公开了一种爬虫采集内容结构化的方法,适用于爬虫对网页的解析阶段,其适用的体系结构包括:爬虫模块、解析模块和结合模块;其中,爬虫模块实现整个数据采集过程,包含结合模块;解析模块是实现网页解析的独立模块;结合模块用于连...
程瑶
文献传递
共1页<1>
聚类工具0