您的位置: 专家智库 > >

国家242信息安全计划(2009A90)

作品数:1 被引量:19H指数:1
相关作者:张旭刘春阳周斌黄九鸣贾焰更多>>
相关机构:国防科学技术大学国家互联网应急中心更多>>
发文基金:国家242信息安全计划国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇会议论文
  • 1篇期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇运行效率
  • 1篇识别技术
  • 1篇随机场
  • 1篇体系架构
  • 1篇条件随机场
  • 1篇文本
  • 1篇会话
  • 1篇架构
  • 1篇HADOOP
  • 1篇并行化
  • 1篇抽取
  • 1篇抽取技术

机构

  • 3篇国防科学技术...
  • 1篇国家互联网应...

作者

  • 3篇吴泉源
  • 3篇周斌
  • 1篇贾焰
  • 1篇黄九鸣
  • 1篇刘春阳
  • 1篇张旭

传媒

  • 2篇第25次全国...
  • 1篇软件学报

年份

  • 1篇2012
  • 2篇2010
1 条 记 录,以下是 1-3
排序方式:
基于Hadoop的并行化命名实体识别技术研究与实现
实体识别是自然语言处理的基础领域,是信息抽取、信息检索、机器翻译、问答系统等自然语言处理技术的基础.对于大规模数据,采用单机识别其中的命名实体耗时较长;因此本文针对大规模数据,采用条件随机场算法,基于Hadoop的Map...
张佳宝周斌吴泉源
关键词:识别技术
短文本信息流的无监督会话抽取技术被引量:19
2012年
文本会话抽取将网络聊天记录等短文本信息流中的信息根据其所属的会话分检到多个会话队列,有利于短文本信息的管理及进一步的挖掘.现有的会话抽取技术主要对基于文本相似度的聚类方法进行改进,面临着短文本信息流的特征稀疏性、奇异性和动态性等挑战.针对这些挑战,研究无监督的会话抽取技术,提出了一种基于信息流时序特征和上下文相关度的抽取方法.首先研究了信息流的会话生命周期规律,提出基于信息产生频率的会话边界检测方法;其次提出信息间的上下文相关度概念,采用基于实例的机器学习方法计算该相关度;最后综合信息产生频率和上下文相关度,设计了基于Single-Pass聚类模型的会话在线抽取算法SPFC(single-pass based on frequency and correlation).真实数据集上的实验结果表明,SPFC算法与已有的基于文本相似度的会话抽取算法相比,F1评测指标提高了30%.
黄九鸣吴泉源刘春阳张旭贾焰周斌
基于UIMAAS的文本挖掘系统的性能分析与评估
基于大规模文本数据挖掘平台UIMA AS设计了文本挖掘系统MTMS.该系统针对分布式存储的海量数据,系统内部组件采用松耦合的通讯方式,同时各部件并行处理,大大提高了系统的吞吐率.为提高MTMS数据处理速度,本文从文本挖掘...
蒋子海周斌吴泉源
关键词:体系架构运行效率
共1页<1>
聚类工具0