何骥
- 作品数:4 被引量:79H指数:3
- 供职机构:上海交通大学更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 文本自动分类中的词权重与分类算法被引量:53
- 2000年
- 本文详细阐述了自动分类中的词与文献的相关权重的经典计算方法IDF(InverseDocumentFrequency) ,进一步总结了两种典型的分类算法———Bayes判别准则与向量空间模型 (VSM) ,并提出结合词权重和分类算法进行分类的具体公式以及相关实验结果。
- 刁倩王永成张惠惠何骥
- 关键词:IDF文本信息检索
- 基于知识的中文文献自动分类系统的理论研究和系统实现
- 研究人员针对目前网上中文文本的内容分布特点,分析中国图书分类法体系的利弊,提出了一个新的分类法体系,并提供了这两种分类法体系之间的自动转换.研究人员采用模式识别基本方法,参考不同信息处理理论,总结和改进了三种分类方法,即...
- 何骥
- 关键词:中文文献
- 文献传递
- 中文文献自动分类中的知识库构造及其仿人算法被引量:9
- 2000年
- 本文阐述了自动分类中的仿人思想 ,并用分类域模型来描述中文信息自动分类中的分类法 ,通过计算类别特征项在分类域中的Hamming距离 ,对类别特征项依据其在分类域中的类别分布进行聚类 ,从而实现对向量分类法中的特征向量维数的压缩 ,并进一步构造用于中文自动分类的知识库。
- 刁倩张惠惠王永成何骥
- 关键词:中文文献知识库仿人算法
- VSM中词权重的信息熵算法被引量:17
- 2000年
- 本文提出一种基于Shannon信息熵的向量空间模型 (VSM )中的词权重算法。同时结合词与文献的相关权重的经典计算方法IDF(InverseDocumentFrequency) ,进一步总结了向量空间模型 (VSM)中两种词权重计算的具体公式。
- 刁倩王永成张惠惠何骥
- 关键词:向量空间模型信息熵VSM