国家自然科学基金(60773011)
- 作品数:3 被引量:7H指数:2
- 相关作者:姬东鸿刘德喜卢露朱福喜张明尧更多>>
- 相关机构:武汉大学江西财经大学长江大学更多>>
- 发文基金:国家自然科学基金国家教育部“985工程”更多>>
- 相关领域:自动化与计算机技术更多>>
- Entropy-based Clustering for Improving Document Re-ranking
- Document re-ranking locates between initial retrieval and query expansion in information retrieval system.In t...
- Chong Teng
- 关键词:COMPONENTCLUSTERING
- 基于基本要素的文摘内容连贯性评测模型被引量:4
- 2008年
- 文摘的自动化面临诸多因难,一个重要的原因是对文摘的内容缺乏有效的自动评测方法.文中提出了基于基本要素(BE)关系网格的文摘内容连贯性评测模型.模型以BE为内容单元,以BE中的"关系"为内容单元的语法角色,通过BE关系在BE关系网格中的转移概率来表达文摘内容的连贯性.在DUC2005数据集上的评测结果显示,模型评测结果与人工评测结果的Pearson相关系数为0.408,比Lapata2005年提出的实体网格模型得到的结果提高了约66%.
- 刘德喜姬东鸿
- 关键词:自动文摘
- 代表性博文选择的博客兴趣建模被引量:3
- 2011年
- 随着博客信息源成指数级的增长,在博客空间中的信息检索,知识发现等任务正面临着巨大的挑战.博客特有的格式为以博客为载体的数据挖掘任务带来不便.本文提出挑选最具代表性的m个博文构成的博文集对博客兴趣建模,挑选的标准保证博文集中博文的重要性和主题多样性,并根据这两个指标来构造博文评估函数,将其转换成实例选择优化问题求解.实验以博客分类为目标,表明通过本文方法预处理后的博客,能够降低时间复杂度,提高分类准确率.
- 卢露朱福喜