国家自然科学基金(61063032)
- 作品数:23 被引量:56H指数:4
- 相关作者:蒙祖强覃华周石泉黄柏雄许珂更多>>
- 相关机构:广西大学广西工业职业技术学院江西师范大学更多>>
- 发文基金:国家自然科学基金广西教育厅科研项目广西壮族自治区自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 结合语义和文本特征位串的高效KNN算法被引量:1
- 2013年
- 为了有效提高文本分类的效率,提出了一种基于语义相似的改进KNN算法。该算法结合了特征词的语义和文本的特征位串,由于考虑到文本向量中同义的关联特征词对文本相似度的贡献,有效地提高了文本分类的准确率和召回率;而基于文本特征位串进行的位计算方法,能从大量的训练文本集中筛选出可能的相似文本,较好地克服了KNN算法计算量大的问题。算法的分析与实验表明,改进的算法明显提高了KNN的计算效率,同时也提高了分类的准确率和召回率。
- 林啟锋蒙祖强陈秋莲陈智敏
- 关键词:语义关联K最近邻算法文本分类
- ASP.NET环境下Hessian协议Web服务技术的研究被引量:2
- 2011年
- ASP.NET中采用的Web服务技术是基于XML+SOAP协议实现,具有学习起点高、推广难度大等问题。Hessian协议是一种新的Web服务技术,本文着重研究Hessian协议的Web服务在ASP.NET环境下的一般实现过程,为工程实际应用提供另一种选择方案。
- 董婕覃华
- 关键词:ASP.NETWEB服务HESSIAN协议
- 一种基于D^2权重的核k-means聚类算法被引量:1
- 2012年
- 核k-means算法是标准k-means算法的扩展,提高了k-means聚类中对非线性不可分数据的聚类效果.传统核k-means算法的初始中心是随机选取的,导致出现聚类时间较慢、聚类性能低等问题.文中提出了一种基于D2权重的核k-means算法,它根据点对簇内距离的贡献,选取对其贡献最大的点为簇中心,然后在核空间内进行相应的聚类.在UCI数据集上进行实验,实验结果表明,新算法相对于传统的核k-means算法,可以有效地缩短聚类时间,并提高聚类的质量,新算法性能优于传统的核K-means算法.
- 马翩翩苏一丹覃华王晓帅
- 关键词:K-MEANS
- 商空间框架下的大规模SVM数据集约减法
- 2013年
- 借助商空间框架下的粒度分析理论及其计算方法,提出将"粒度"的概念用于大规模SVM数据集的约减来建立商空间框架下的约减模型。该约减模型的约减方向是由远及近地向分类超平面削减,其削减幅度也伴随集合的缩小而由粗到细逐渐变化。同时,给出该模型的一种实现。实验证明,商空间框架下的SVM约减模型比普通SVM约减模型的压缩效果更好。
- 覃希苏一丹张雯
- 关键词:商空间粒度支持向量机
- 用子空间粒子群聚类算法识别Folksonomy标签冗余的研究
- 2012年
- Web2.0标签系统中经常包含很多冗余的标签,标签冗余会增加用户选择喜好项目时的负担,从而影响用户建模和对推荐系统的评估。标签数据集通常存在着大量不相关或是冗余的特征,而不同簇之间的相关特征子集又是不一样的,所以应该从不同的特征子集中来发现簇。提出使用子空间粒子群聚类识别标签冗余,算法采用指数型变权类似K-means的目标函数,该函数对变量权值的改变更加敏感。在此基础上利用粒子群优化目标函数搜寻得到全局最优的标签聚类,提高抽取冗余标签的准确度。实验结果表明,此算法具有较强的全局搜索能力,应用于标签冗余识别获得了更好的精度。
- 王晓帅覃华丁立朵马翩翩
- 基于多线程技术的分辨函数析取范式生成算法被引量:2
- 2013年
- 基于分辨矩阵计算信息系统的所有约简,都需要将合取范式转化为析取范式,但是该转化过程存在组合爆炸问题。为解决该问题,根据合取范式、合取运算和析取运算的特点,构建析取范式转化的并行模型,提出基于多线程技术的分辨函数析取范式生成算法,利用Windows的自动线程调度功能提高范式转换的效率。实验结果表明,该算法的析取范式转化效率会随着合取范式长度的增加而提高,适合在多核CPU计算机上运行。
- 蒙祖强周石泉黄柏雄
- 关键词:属性约简多线程技术析取范式
- 基于时间依赖的物联网络模型的路径规划被引量:2
- 2013年
- 本文针对基于物联网的物流网络中路径代价的时变性,建立一种时间依赖的物联网络模型,并在此基础上研究物流路径规划问题。针对现实中预测准确性随时间推移而降低,以及在预知程度较低时无法获得较好的路径规划等问题,提出一种带弧代价预知程度参数的最小时间路径算法SW PL以及基于SW PL的逐步规划解决方案。该算法考虑了预测的精度问题,在传统Dijkstra算法的基础上引入一种与时间相关的弧代价计算方法。实验表明,在预知程度较高和在预知程度较低但采用逐步规划的解决方案2种情况下,都能取得良好的路径规划效果。
- 杨俊瑶蒙祖强
- 关键词:物联网路径规划时间依赖网络
- 一种新的网络热点话题提取方法被引量:6
- 2013年
- 网络热点话题提取是网络舆情分析的重要手段,已成为信息检索领域研究的热点内容之一.传统聚类方法因其聚类结果不允许相交等因素,暴露了其在基于(主题)词聚类进行话题发现中的诸多缺点.本文基于小世界理论建立词的共现网络模型并去除大量冗余词,然后运用极大相容块技术并基于过滤后的词共现网络实现对相交话题的提取,获取网络热点话题.本文方法与传统聚类方法有本质区别,基于(主题)词聚类进行话题发现具有独特的优势,较好克服了已有方法的缺点.实验说明了本文方法对提取网络热点话题是有效和可行的,比同类算法具有更好的性能,且具有较好的可伸缩性.
- 蒙祖强黄柏雄
- 关键词:词聚类文本聚类
- 一种基于维规约的属性加权朴素贝叶斯算法
- 2013年
- 朴素贝叶斯算法是一种简单而高效的分类算法,但它的属性的条件独立性假设在现实中往往不成立,而且算法本身对高维数据不敏感,如何提高高维数据的分类性能是一个重要的问题。通过确定权重系数进行算法改进,用改进的算法对基于条件信息熵、主成分分析和独立成分分析处理的数据进行分类,并分析性能。
- 杨忠强秦亮曦
- 关键词:朴素贝叶斯属性加权
- 用Hessian协议实现3G终端接入图书馆系统的研究被引量:3
- 2013年
- 提出使用轻量级的Hessian协议实现3G终端接入图书馆系统的富客户端方案,在讨论Hessian协议编程方法的基础上,给出馆藏书目查询案例的实现过程。案例实施表明该方案具有易于实现、传输效率高、开销小等优点,是一种轻量级的移动接入方案,具有良好的工程应用前景。
- 孙欣覃华邓海
- 关键词:富客户端HESSIAN协议3G