江苏省教育厅哲学社会科学基金(2012SJD870001) 作品数:4 被引量:8 H指数:2 相关作者: 刘金岭 马甲林 张一洲 金春霞 于长辉 更多>> 相关机构: 淮阴工学院 中共淮安市委党校 更多>> 发文基金: 江苏省教育厅哲学社会科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于概念簇的文本分类算法 被引量:2 2013年 针对传统文本分类算法在向量空间模型表示下存在向量高维、稀疏以及忽略特征语义相关性等缺陷所导致的分类效率低和精度不高的问题,以知网(HowNet)为知识库,构建语义概念向量模型SCVM(Semantic Concept Vector Model)表示文本,根据概念语义及上下文背景对同义词进行归并,对多义词进行排歧,提出基于概念簇的文本分类算法TCABCC(Text Classification Algorithm Based on the Concept of Clusters),通过改进传统KNN,用概念簇表示各个类别训练样本,使相似度的计算基于文本概念向量和类别概念簇。实验结果表明,该算法构造的分类器在效率和性能上均比传统KNN有较大的提高。 马甲林 刘金岭 金春霞关键词:文本分类 KNN 知网 基于VSM和偏好本体的个性化信息检索技术的研究 被引量:5 2015年 信息检索技术特别注重向量空间模型和偏好本体的结合。为便于找出用户输入的关键词间的关系,利用本体的关联分析及模糊本体值计算关键词间的相似度,本文采用加权算法和排序算法计算每个文档的权重,并根据文档权重进行检索结果的重排。为优化重排模型,本文还对每个检索对象的驻留时间进行合并,并使用衡量搜索引擎质量指标和评价标准F-measure对本文提出的重排机制性能进行测试。实验结果表明,使用本方法进行个性化信息检索的性能优于Google方法。 张一洲关键词:信息检索 云计算中虚拟资源的智能多代理设计 2012年 针对随着网络数据传输速度和复杂性的不断增加,网络管理变得更加困难的现状,提出了一种虚拟资源的智能多代理模型。描述了虚拟资源的智能多代理的处理过程,讨论了不同代理的处理机制。通过分析用户上下文和系统状态,可实时地分析社会媒体资源。根据虚拟资源的使用类型,对用户上下信息的需求进行分析和推断,自动地给用户分配资源。采用云计算中虚拟资源动态调度方法及MovieLens系统评估该模型,结果证明所提出的模型具有较好的性能,可实现虚拟资源的动态调度,动态地实现负载均衡,使云计算中的虚拟资源得到高效的利用。 王留洋 俞扬信 周淮关键词:虚拟资源 云计算 动态调度 一种高效中文文本聚类算法 被引量:1 2013年 文本聚类算法面临着文本向量高维和极度稀疏的问题,传统降维方法多数是在假设关键词相互独立的前提下,通过统计的方法进行特征提取,这种方法往往忽略了文本在上下文语境中的语义关系,导致文本语义大量丢失。利用《知网》知识库,通过计算语义类相似度,构建了带权值的多条词汇链,根据权值大小,从中选取权值最大和次大的前两个词汇链组成代表文本的关键词序列,在此基础上提出了基于主题词汇链的文本聚类算法—TCABTLC,不但可以解决文本向量高维和稀疏导致的聚类算法运行效率低的问题,而且得到了较好的聚类效果。实验表明,在保持较好准确率下,该聚类算法的时间效率得到了大幅度提高。 马甲林 刘金岭 于长辉关键词:知网 向量模型 词汇链 文本聚类