庞斌
- 作品数:4 被引量:16H指数:2
- 供职机构:北京航空航天大学计算机学院软件开发环境国家重点实验室更多>>
- 发文基金:国家科技基础条件平台建设计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种有效的中文多文档摘要方法
- 多文档集合的特征,提出了一种基于(Latent SemanticIndex)LSI(潜在语义标引)的多文档摘要自动生成方法LSISUM。该方法在根据词性提取特征的基础上,运用LSI技术对TF-ISF特征矩阵进行概念层次的...
- 林赛群张辉庞斌周刚
- 关键词:多文档摘要凝聚聚类
- 一种基于关键特征的搜索引擎结果聚类算法被引量:7
- 2007年
- 为了解决用户在搜索引擎结果列表中寻找所需信息困难的问题,帮助用户快速有效地定位有价值的Web文档,与向量空间模型方法不同,采用基于关键特征的聚类算法(KFC).首先从搜索引擎返回结果的关键词里选择重要的词作为关键特征,然后通过分析特征间的关系对特征聚类,最后基于特征聚类结果实现文档的聚类.通过对实验结果的测试表明了算法的有效性.
- 张辉谢科庞斌吴辉
- 关键词:搜索引擎特征提取文档聚类
- 文本分类系统关键技术被引量:9
- 2007年
- 从自然语言的角度考虑词性选择,同时从统计学角度考虑删除文档频率过低的特征词,从而避免产生维数灾难,通过考查类别本身特征和类别之间的关系来提取类别特征向量,采用传统夹角余弦公式考查文本与类别的相似度,实现一种过程简单,易于理解且分类效果不错的文本分类系统。
- 谢科张辉陈鹏庞斌
- 关键词:文本分类向量空间模型
- 基于LSI的多文档摘要自动生成技术研究与实现
- 庞斌
- 关键词:多文档摘要聚类K-MEANS聚类算法