您的位置: 专家智库 > >

教育部科学技术研究重点项目(108126)

作品数:4 被引量:45H指数:3
相关作者:瞿有利田盛丰龚书黄厚宽税仪冬更多>>
相关机构:北京交通大学更多>>
发文基金:教育部科学技术研究重点项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 2篇语言处理
  • 2篇语义
  • 2篇自动文摘
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇文摘
  • 1篇多文档
  • 1篇多文档文摘
  • 1篇新闻
  • 1篇新闻报
  • 1篇新闻报道
  • 1篇语义分析
  • 1篇语义模型
  • 1篇增量聚类
  • 1篇知网
  • 1篇周期
  • 1篇维基百科
  • 1篇文本分类
  • 1篇文档
  • 1篇聚类

机构

  • 4篇北京交通大学

作者

  • 4篇瞿有利
  • 2篇龚书
  • 2篇田盛丰
  • 1篇税仪冬
  • 1篇黄厚宽
  • 1篇焦健

传媒

  • 3篇北京交通大学...
  • 1篇南京大学学报...

年份

  • 1篇2011
  • 3篇2009
4 条 记 录,以下是 1-4
排序方式:
周期分类和Single-Pass聚类相结合的话题识别与跟踪方法被引量:28
2009年
针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定程度之后,对已经聚类的报道进行周期分类,使话题簇精度提高,从而提高后续话题识别与跟踪精度.实验表明这种方法是有效的,能够降低漏检率与错检率,减少归一化错误识别代价.
税仪冬瞿有利黄厚宽
关键词:话题识别与跟踪增量聚类文本分类
基于语义的自动文摘研究综述被引量:4
2009年
基于语义的自动文摘方法能解决自动文摘处理中语言复杂性问题,在克服领域局限性的同时从本质上提高文摘的质量.常用语义模型包括统计主题模型和语义知识模型.基于语义的自动文摘是对传统文摘技术基于语义模型的扩充,在自动文摘的预处理、文档转换、文档候选片段提取和文摘生成4个基本过程中使用各种语义分析方法.
龚书瞿有利田盛丰
关键词:自然语言处理自动文摘语义语义模型本体
知网的话题更新与跟踪算法研究被引量:11
2009年
话题跟踪是一项面向新闻报道信息流进行已知话题跟踪的信息处理技术,本文在现有的向量空间描述文档的基础上,实现了一个基于话题更新的话题跟踪算法,提出了基于知网的近义动词分析的跟踪算法及基于知网的近义动词分析和话题更新的话题跟踪算法.实验表明话题更新和同义词近义词的消除提高了话题跟踪算法的性能.
焦健瞿有利
关键词:自然语言处理新闻报道知网
基于维基语义的多文档文摘研究被引量:2
2011年
多文档文摘作为自然语言处理领域的重要技术之一,能从不同角度辅助用户实现高效的信息获取.由于文档集合内的内容往往来自不同的信息源,文本之间通常存在丰富而复杂的语义关系.常用的基于词的文档表示法,难以为文摘的语义分析过程提供充足而准确的数据信息.为此,我们提出使用维基百科——当今世界最大的在线概念语料库——为多文档文摘的提取提供语义支持.一方面,我们通过提取文档中的维基概念,生成准确一致的句子表示形式.另一方面,在计算句子特征时,我们利用维基词条的首段指导机器文摘的提取.我们首先通过计算概念在维基中的全局相关性和当前文档集内的局部相关性,获取概念的权重.然后在维基概念表示的基础上,为文档中的句子提取多种基于维基的特征,并最后用于文摘生成.在实验中,我们依次用各个维基特征独立生成文摘,并使用ROUGE(Recall-Oriented Understudy for Gisting Evaluation,面向召回率的要点评估)指标评价文摘质量.通过比较,实验验证了维基词条首段能较好的提升文摘质量.
龚书瞿有利田盛丰
关键词:自动文摘语义分析维基百科
共1页<1>
聚类工具0