您的位置: 专家智库 > >

文献类型

  • 6篇专利
  • 1篇期刊文章

领域

  • 3篇自动化与计算...

主题

  • 3篇文本
  • 3篇词项
  • 2篇带宽
  • 2篇带宽资源
  • 2篇队列
  • 2篇多线程
  • 2篇通信
  • 2篇通信量
  • 2篇爬虫
  • 2篇主机
  • 2篇字典
  • 2篇网络
  • 2篇网络爬虫
  • 2篇网页
  • 2篇网页分析
  • 2篇线程
  • 2篇缓冲队列
  • 2篇集群系统
  • 2篇广告
  • 1篇迭代

机构

  • 7篇中国科学院
  • 1篇中山大学
  • 1篇天津海量信息...

作者

  • 7篇赵中英
  • 7篇刘明君
  • 4篇冯圣中
  • 4篇何一峰
  • 4篇冯铮
  • 3篇章昉

传媒

  • 1篇集成技术

年份

  • 3篇2017
  • 1篇2015
  • 3篇2014
7 条 记 录,以下是 1-7
排序方式:
一种基于微博的广告推荐方法及系统
本发明适用于数据挖掘领域,提供了一种基于微博的广告推荐方法及系统。所述方法包括:读取微博数据;初始化微博数据,获得微博文本词项集合;删除微博文本词项集合的停用词,获得微博文本原始特征词项集合;将微博文本原始特征词项集合与...
章昉刘明君赵中英
应用于单台多核处理器主机的多线程网络爬虫执行方法
本发明提出的应用于单台多核处理器主机的多线程网络爬虫执行方法包括步骤:S10、创建网页爬取线程、网页分析线程以及URL种子线程;S20、将URL种子载入URL种子缓冲队列;S30、从URL种子缓冲队列中取出URL种子块,...
冯铮赵中英刘明君何一峰冯圣中
一种基于微博的广告推荐方法及系统
本发明适用于数据挖掘领域,提供了一种基于微博的广告推荐方法及系统。所述方法包括:读取微博数据;初始化微博数据,获得微博文本词项集合;删除微博文本词项集合的停用词,获得微博文本原始特征词项集合;将微博文本原始特征词项集合与...
章昉刘明君赵中英
文献传递
一种大规模图结构数据处理方法、装置和系统
本发明公开了一种大规模图结构数据处理方法、装置和系统,以提高数据计算效率并增强系统运行的可靠性。所述方法包括:从节点将图结构数据读取至内存;对内存中的图结构数据进行预处理,得到图结构数据中相邻顶点处于同一数据片的至少一个...
刘明君赵中英冯铮何一峰冯圣中
基于词项关联的短文本分类研究被引量:2
2015年
以短文本为主体的微博等社交媒体,因具备文本短、特征稀疏等特性,使得传统文本分类方法不能够高精度地对短文本进行分类。针对这一问题,文章提出了基于词项关联的短文本分类方法。首先对训练集进行强关联规则挖掘,将强关联规则加入到短文本的特征中,提高短文本特征密度,进而提高短文本分类精度。对比实验表明,该方法一定程度上减缓了短文本特征稀疏特点对分类结果的影响,提高了分类准确率、召回率和F1值。
章昉颜华驹刘明君赵中英
关键词:数据挖掘关联规则
一种大规模图结构数据处理方法、装置和系统
本发明公开了一种大规模图结构数据处理方法、装置和系统,以提高数据计算效率并增强系统运行的可靠性。所述方法包括:从节点将图结构数据读取至内存;对内存中的图结构数据进行预处理,得到图结构数据中相邻顶点处于同一数据片的至少一个...
刘明君赵中英冯铮何一峰冯圣中
文献传递
应用于单台多核处理器主机的多线程网络爬虫执行方法
本发明提出的应用于单台多核处理器主机的多线程网络爬虫执行方法包括步骤:S10、创建网页爬取线程、网页分析线程以及URL种子线程;S20、将URL种子载入URL种子缓冲队列;S30、从URL种子缓冲队列中取出URL种子块,...
冯铮赵中英刘明君何一峰冯圣中
文献传递
共1页<1>
聚类工具0