许世明
- 作品数:2 被引量:19H指数:1
- 供职机构:中国科学院深圳先进技术研究院更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于预分类的高效SVM中文网页分类器被引量:19
- 2010年
- 中文网页分类技术是数据挖掘研究中的一个热点领域,而支持向量机(SVM)是一种高效的分类识别方法。首先给出了一个基于SVM的中文网页自动分类系统模型,详细介绍了分类过程中涉及的一些关键技术,其中包括网页预处理、特征选择和特征权重计算等。提出了一种利用预置关键词表进行预分类的方法,并详细说明了该方法的原理与实现。实验结果表明,该方法与单独使用SVM分类器相比,不仅大大减少了分类时间,准确率和召回率也明显提高。
- 许世明武波马翠邸思徐洪奎杜如虚
- 关键词:支持向量机中文网页分类文本分类
- 中文网页分类技术研究及预分类算法实现
- 随着信息技术的迅速发展,特别是近年来互联网的普及,网页数量呈指数级增长。为了有效地组织和管理这些海量信息,如何根据网页中的文本信息自动分类已成为目前研究的重要课题。
本文首先研究了中文网页自动分类的相关技术,详细...
- 许世明
- 关键词:中文网页分类朴素贝叶斯支持向量机
- 文献传递