江苏省高校自然科学研究项目(10KJB520016)
- 作品数:2 被引量:6H指数:1
- 相关作者:周国栋王红玲朱巧明张永磊更多>>
- 相关机构:苏州大学更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向冗余度控制的中文多文档自动文摘被引量:6
- 2012年
- 多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文在考虑文摘特性的基础上提出了一个冗余度控制模型,该模型通过计算文本单元在主题概率分布之间的相似度来决定句子的选择,从而达到控制冗余的目的。实验结果表明,该方法能够有效降低冗余度,且总体性能优于现有的自动文摘系统。
- 王红玲周国栋朱巧明
- 关键词:多文档自动文摘中文自动文摘
- 面向冗余度控制的中文多文档自动文摘
- 多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。本文在...
- 王红玲黄超超张明慧周国栋
- 关键词:多文档自动文摘中文自动文摘
- 文献传递
- 基于结构化学习的语句压缩研究
- 2013年
- 近年来随着各类信息的日益增多,语句压缩作为自动摘要的重要部分也越来越引起研究者的关注。然而当前针对语句压缩的研究才刚刚展开,存在压缩效果不佳、没有统一的自动评测指标等问题。该文在简单的删除单词的方法框架下,采用基于特征权重的最大边缘训练的结构化学习方法实现语句压缩。同时该文还提出了两种新的自动评价指标(N-Gram和BLEU)来评价语句压缩的性能。实验结果表明,采用结构化学习方法能够在保持较好压缩率的情况下保留源语句的主要信息,并且新提出的两个评价指标能够有效反映语句压缩性能。
- 张永磊王红玲周国栋
- 关键词:自动评测