您的位置: 专家智库 > >

许虎寅

作品数:6 被引量:32H指数:3
供职机构:西北师范大学数学与信息科学学院更多>>
发文基金:国家自然科学基金美国福特基金甘肃省科技攻关计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 1篇学位论文

领域

  • 6篇自动化与计算...

主题

  • 4篇聚类
  • 2篇特征选择算法
  • 2篇文档
  • 2篇词频
  • 1篇训练集
  • 1篇数据结构
  • 1篇数据流
  • 1篇数据流聚类
  • 1篇文本分类
  • 1篇文本聚类
  • 1篇经济困难
  • 1篇经济困难学生
  • 1篇聚类算法
  • 1篇家庭
  • 1篇家庭经济
  • 1篇家庭经济困难
  • 1篇家庭经济困难...
  • 1篇家庭经济困难...
  • 1篇高校
  • 1篇高校家庭经济...

机构

  • 6篇西北师范大学
  • 2篇驻马店职业技...

作者

  • 6篇许虎寅
  • 5篇王治和
  • 4篇陈建华
  • 4篇樊东辉
  • 1篇蒋芸

传媒

  • 2篇微电子学与计...
  • 1篇电脑知识与技...
  • 1篇甘肃联合大学...
  • 1篇电脑知识与技...

年份

  • 3篇2012
  • 3篇2011
6 条 记 录,以下是 1-6
排序方式:
基于DF算法改进的文本聚类特征选择算法被引量:6
2012年
通过研究文本特征选取中权重的计算问题,提出了一种利用特征词的熵函数加权的权值的计算方法,不但考察了特征词的文档频数,而且考察了它们在文档中出现的次数,使选出的特征子集更具有较好的代表性.实验表明,改进后的算法对聚类结果有了一定的改进.
樊东辉王治和陈建华许虎寅
关键词:词频
高校家庭经济困难学生认定系统的设计与实现被引量:3
2011年
为解决当前高校家庭经济困难学生认定J-作中的诸多困难.文章使用visual c#开发语言和SQL server数据库.在.net框架下设计并实现了基于B/S模式的高校家庭经济困难学生认定系统,对高校学生家庭经济状况进行定量和定性分析,采用工作流的模式分阶段分层次对学生进行筛选和审核认定,有效提高了高校家庭经济困难学生认定资助27-作的规范合理化和工作效率。
许虎寅王治和陈建华樊东辉
关键词:ASP.NET高校家庭经济困难学生
一种改进的基于密度的聚类算法被引量:20
2012年
聚类是数据挖掘领域中的一个重要研究方向,在基于密度的聚类算法DBSCAN的基础上,提出了一种改进的基于密度的聚类算法,该算法在核心点的邻域扩展中不再将邻域内的点作为种子点,而是按顺序选择一个邻域外未被标记的点作为种子点,然后分不同情况进行相应的聚类扩展,此算法可以有效减少聚类中核心点邻域重叠区域查询的次数和运行的时间,实验测试结果也表明该算法聚类的效率和质量明显优于DBSCAN算法.
许虎寅王治和
关键词:DBSCAN聚类
基于密度和网格的数据流聚类算法研究
近些年来,由于计算机及信息技术的高速发展,人们获取数据的能力极大的提高,数据流作为一类重要的数据来源,越来越受到关注。  数据流是连续的、快速变化的、有序的、海量的数据,不同于传统的存储在磁盘上的静态的数据,而是一类新型...
许虎寅
关键词:数据流聚类算法数据结构
文献传递
一种改进的文本分类特征选择算法
2011年
现有的一种特征选择算法DPM(Discriminating Power Measure)[1],是通过计算每个特征在某一类别和剩余其他类别中的文档频,比较了特征对一个类别和对其他类别的贡献,提取出具有强类别区分能力的特征词.在研究此特征选择算法的基础上,提出了一种改进的特征选择算法,该算法同时考虑了每个特征的类别频次在计算特征类别区分能力方面的重要性.经实验验证,改进后的特征选择算法能够获得较好的分类效果.
陈建华王治和蒋芸许虎寅樊东辉
关键词:DPM词频
基于聚类的KNN算法改进被引量:2
2011年
通过研究KNN算法,提出了一种利用训练集文本聚类结果改进KNN算法的方法,首先将训练集文本采用DBSCAN算法聚进行聚类,将训练集文本分为若干个簇,然后采用KNN算法对测试文档进行测试,最后用距离最近的n个簇中的若干训练集文本使用KNN算法对测试文本进行分类。实验表明,改进后的算法降低了计算量,提高了效率,同时对聚类结果有了一定的改进。
樊东辉王治和陈建华许虎寅
关键词:KNN算法DBSCAN算法训练集
共1页<1>
聚类工具0