您的位置: 专家智库 > >

国家242信息安全计划(2011A010)

作品数:6 被引量:87H指数:5
相关作者:贾焰韩伟红何力丁兆云周斌更多>>
相关机构:国防科学技术大学中国人民解放军77675部队北京大学更多>>
发文基金:国家242信息安全计划国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 2篇会议论文

领域

  • 8篇自动化与计算...

主题

  • 3篇社交
  • 3篇网络
  • 3篇文本分类
  • 2篇社交网
  • 2篇社交网络
  • 1篇意见领袖
  • 1篇用户
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇社会网
  • 1篇社会网络
  • 1篇数据分类
  • 1篇数据库
  • 1篇数据挖掘
  • 1篇搜索
  • 1篇搜索问题
  • 1篇网络影响力
  • 1篇无标记
  • 1篇向量
  • 1篇向量机

机构

  • 8篇国防科学技术...
  • 1篇北京大学
  • 1篇中国人民解放...

作者

  • 5篇贾焰
  • 3篇何力
  • 3篇韩伟红
  • 3篇杨树强
  • 2篇谭霜
  • 2篇丁兆云
  • 2篇周斌
  • 2篇陈志坤
  • 1篇韩毅
  • 1篇汪祥
  • 1篇赵辉
  • 1篇尹洪
  • 1篇陈儒华
  • 1篇徐锡山
  • 1篇金松昌
  • 1篇肖英
  • 1篇喻承

传媒

  • 2篇计算机学报
  • 1篇计算机研究与...
  • 1篇计算机工程与...
  • 1篇计算机科学
  • 1篇智能系统学报
  • 1篇第九届中国通...

年份

  • 4篇2014
  • 1篇2013
  • 3篇2012
6 条 记 录,以下是 1-8
排序方式:
社交网络影响力研究综述被引量:29
2014年
互联网正逐步演变为无处不在的计算平台和信息传播平台。在线社交网站、微博、博客、论坛、维基等社交网络应用的出现和迅猛发展,使得人类使用互联网的方式产生了深刻变革——由简单信息搜索和网页浏览转向网上社会关系的构建与维护、基于社会关系的信息创造、交流和共享。社交网络中个体间的交互形成影响力,社交网络中的影响力主要依赖个体间的关系强度、个体间的网络距离、时序因子以及网络特征与个体特征等。影响力分析技术的相关研究主要包括个体间的影响强度度量技术、个体影响力度量技术、影响力扩散机制等。
丁兆云贾焰周斌唐府
关键词:社会网络数据挖掘意见领袖
基于交互关系的微博用户标签预测被引量:12
2013年
在当今以用户贡献内容为核心的社交网络中,标签成为用户对资源进行标记和分类的重要依据。在新浪微博中,用户可以自由地给自己打上标签以表明自己的兴趣和特征等,用户标签在舆情分析与监测、广告推送和网络营销等应用中起到了非常重要的作用。针对新浪微博中绝大部分用户没有标签或标签较少的问题,提出了基于用户交互行为而产生的交互图的用户标签预测方法。在新浪微博用户量为1.4亿的真实数据集和大数据分析处理平台Hadoop上进行分析发现,本文提出的方法比当前常用的标签预测方法取得了更好的效果。
汪祥贾焰周斌陈儒华韩毅
关键词:标签推荐社交网络
面向海量数据非关系数据库的测试基准研究
海量数据非关系数据库虽然起步晚,但其具有传统关系数据库不能比拟的优势和特点,因此发展十分迅速。在当下云计算风起云涌,数据量越来越庞大,数据访问和数据处理越来越频繁的时代,海量数据非关系数据库越来越发挥其重要作用。然而,使...
喻承杨树强肖英
关键词:NOSQL数据库
文献传递
基于无标记Web数据的层次式文本分类
2014年
传统的文本分类方法需要标注好的语料来训练分类器,然而人工标记语料代价高昂并且耗时。对此,通过无类别标记的Web数据来训练文本分类器,提出一种基于无标记Web数据的层次式文本分类方法,该方法结合类别知识和主题层次信息来构造Web查询,从多种Web数据中搜索相关文档并抽取学习样本,为监督学习找到分类依据,并结合层次式支持向量机进行分类器的学习。实验结果表明,该方法能够利用无标记Web数据学习分类器,并取得了较好的分类效果,其性能接近于有标记训练样本的监督分类方法。
何力谭霜贾焰韩伟红
关键词:支持向量机
大规模层次分类中的候选类别搜索被引量:19
2014年
大规模层次分类问题研究如何将互联网上的网页文档准确地分到类别层次中的各个类别.因为类别层次规模巨大,通常可以达到数千甚至数万个类别,严重影响了分类性能.对此,已有研究通过搜索待分类文档在类别层次中的候选类别对文档进行分类,但结果表明候选类别搜索成为了其中瓶颈.文中首先对候选搜索问题的计算复杂性进行了分析,证明了该问题是NP难的,接下来提出了一个基于贪心策略的启发式候选搜索算法,并且证明了该贪心策略在求解过程中是一个局部最优选择.作者采用DMOZ目录中的简体中文网页数据进行了实验论证,实验结果显示,相比已有算法,文中提出的候选类别搜索算法在候选类别搜索的准确率上提高了大约7.5%.
何力丁兆云贾焰韩伟红
关键词:文本分类社交网络
基于MapReduce模型的范围查询分析优化技术研究被引量:14
2014年
近年来,MapReduce并行计算模型受到工业界和学术界广泛关注.基于该模型的系统实现已在谷歌、雅虎、Facebook等大公司内部成功应用.然而,基于MapReduce的系统实现最初用于解决海量无结构、半结构化数据的批处理问题,例如生成倒排索引、计算网页的pagerank、日志分析等,在设计上缺乏针对海量结构化数据进行交互式分析处理的优化考虑,例如:它总是采用全数据集强力扫描的数据处理模式,这有悖于结构化数据管理中常用的操作模式———选择性查询分析处理.针对该问题,引入传统数据库管理领域中常用的全局索引技术,将其应用在基于MapReduce模型的开源项目Hadoop上,以block为粒度对Hadoop分布式文件系统上的结构化数据构建全局索引结构,并给出一种面向范围查询分析的作业编译与调度执行优化算法,主要目标是基于应用语义及辅助索引结构减少不必要的map任务数,进而优化作业的调度开销和执行开销.在实验验证阶段,给出了80%,50%,30%,10%四种数据选择率在3种集群规模下的优化效果,发现作业响应时间最高可提升5倍,I?O开销最高提升10倍,任务调度开销最高提升11倍.
赵辉杨树强陈志坤尹洪金松昌
关键词:范围查询
针对HBase的MapReduce访问接口的优化
现有的HBase提供的MapReduce访问接口存在数据读取速度较慢的问题。针对此问题本文提出了一种改进方法,该方法不以原来的逻辑存储单元Region作为任务分配的基本单位,而是以HBase的物理存储单元Block作为任...
田胜利徐锡山杨树强华中杰
关键词:HBASEMAPREDUCE
文献传递
大规模层次分类问题研究及其进展被引量:14
2012年
随着信息技术的发展,互联网数据急剧增长.为了有效地组织和管理这些海量网页信息,通常按照一个大规模的概念或主题类别层次对网络上的信息进行分类,以更好地搜索和访问这些网络资源.在这个过程中,大规模层次分类问题研究如何将互联网上的网页文档准确地分到类别层次中的各个类别.该文对大规模层次分类问题进行了分析.首先,给出了大规模层次分类问题的定义,分析了大规模层次分类问题的求解策略;其次,对大规模层次分类问题的求解方法加以分类,在分类基础上,介绍了各种典型的求解方法并进行了对比;最后总结了各种大规模层次分类问题求解方法并指出了未来的研究方向.
何力贾焰韩伟红谭霜陈志坤
关键词:文本分类
共1页<1>
聚类工具0