您的位置: 专家智库 > >

国家自然科学基金(31372250)

作品数:11 被引量:320H指数:6
相关作者:谢娟英谢维信高红超许升全王艳娥更多>>
相关机构:陕西师范大学深圳大学延安大学更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金陕西省科技攻关计划更多>>
相关领域:自动化与计算机技术生物学更多>>

文献类型

  • 11篇中文期刊文章

领域

  • 8篇自动化与计算...
  • 3篇生物学

主题

  • 5篇聚类
  • 3篇聚类算法
  • 2篇聚类中心
  • 2篇初始聚类中心
  • 1篇地理种群
  • 1篇新纪录种
  • 1篇征子
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇秩和检验
  • 1篇中华蜜蜂
  • 1篇山溪鲵
  • 1篇生成树
  • 1篇搜索
  • 1篇特征选择算法
  • 1篇特征子集
  • 1篇评价指标
  • 1篇区分度
  • 1篇种群
  • 1篇子集

机构

  • 10篇陕西师范大学
  • 2篇深圳大学
  • 1篇延安大学

作者

  • 8篇谢娟英
  • 2篇许升全
  • 2篇高红超
  • 2篇谢维信
  • 1篇董亚非
  • 1篇王艳娥
  • 1篇王文强
  • 1篇马永贵
  • 1篇王贵虎
  • 1篇管德龙
  • 1篇陈振宁
  • 1篇屈亚楠
  • 1篇张秀秀
  • 1篇王明钊
  • 1篇高瑞
  • 1篇丁义晶
  • 1篇周颖

传媒

  • 2篇计算机应用研...
  • 2篇陕西师范大学...
  • 1篇动物学杂志
  • 1篇南京大学学报...
  • 1篇计算机学报
  • 1篇计算机工程
  • 1篇软件学报
  • 1篇中国科学:信...
  • 1篇Zoolog...

年份

  • 1篇2017
  • 3篇2016
  • 2篇2015
  • 5篇2014
11 条 记 录,以下是 1-10
排序方式:
青海省发现两栖纲小鲵科无斑山溪鲵被引量:4
2014年
2012年8月,在青海省果洛藏族自治州班玛县采集到小鲵科山溪鲵属标本2尾,经形态鉴定并和山溪鲵属近缘种进行线粒体Cyt b及COⅠ基因序列比较分析,鉴定为无斑山溪鲵(Batrachuperus karlschmidti),为该物种在青海省内首次发现。
丁义晶王贵虎陈振宁石长宏马永贵许升全
关键词:两栖纲小鲵科
Num-近邻方差优化的K-medoids聚类算法被引量:11
2015年
针对K-medoids聚类算法对初始聚类中心敏感、聚类结果依赖于初始聚类中心的缺陷,提出一种局部方差优化的K-medoids聚类算法,以期使K-medoids的初始聚类中心分布在不同的样本密集区域,聚类结果尽可能地收敛到全局最优解。该算法引入局部方差的概念,根据样本所处位置的局部样本分布定义样本的局部方差,以样本局部标准差为邻域半径,选取局部方差最小且位于不同区域的样本作为K-medoids的初始中心,充分利用了方差所提供的样本分布信息。在规模大小不等的UCI数据集以及带有不同比例噪声的不同规模的人工模拟数据集上进行实验,并利用六种聚类算法性能测试指标进行测试,结果表明该算法具有聚类效果好、抗噪性能强的优点,而且适用于大规模数据集的聚类。提出的Num-近邻方差优化的K-medoids聚类算法优于快速K-medoids聚类算法及基于邻域的改进K-medoids聚类算法。
谢娟英高瑞
关键词:局部方差初始聚类中心聚类
A new record ant species of the genus Cardiocondyla Emery from China(Hymenoptera: Formicidae)被引量:1
2014年
An ant species, Cardiocondyla gibbosa Kuznetzov-Ugamsky, 1927, is newly recorded from China. The specimens were collected from Shule County of Kashgar, Xinjiang(39°14′N, 76° 22′E; elev. 1 248 m). All the specimens are kept in Institute of Zoology, Shaanxi Normal University. A key based on worker caste to known species of Cardiocondyla from China is provided.
Abdukirim GulzarYing TangPeng ZhangSheng-Quan Xu
关键词:新纪录种膜翅目
K-S检验与mRMR相结合的基因选择算法被引量:5
2016年
为了解决基因数据集的基因选择难题,提出一种基于K-S检验与最小冗余最大相关(minimum redundancy-maximum relevance,mRMR)原则的基因选择算法。该算法先采用K-S检验选择出具有一定区分能力的基因,然后对选择到的基因进行mRMR判断,保留与类别高度相关而其间相关性较小的基因构成最终被选基因子集。以SVM为分类器,以F1_measure、分类准确率和AUC为评价指标对该算法选择的基因子集进行评估,并将本算法与K-S检验、mRMR,以及经典的RELIEF和FAST算法进行比较。五个经典基因数据集上的平均实验结果表明:本算法的运行时间远低于mRMR算法,且其各项评价指标值优于其他比较算法。因此,提出的K-S检验与mRMR结合的基因选择算法能选择到非常有效的基因子集。
谢娟英胡秋锋董亚非
关键词:基因选择AUCRELIEF
最小方差优化初始聚类中心的K-means算法被引量:81
2014年
传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该算法运用样本空间分布信息,通过计算样本空间分布的方差得到样本紧密度信息,选择方差最小(即紧密度最高)且相距一定距离的样本作为初始聚类中心,实现优化的K-means聚类。在UCI机器学习数据库数据集和含有噪音的人工模拟数据集上的实验结果表明,该算法不仅能得到较好的聚类结果,且聚类结果稳定,对噪音具有较强的免疫性能。
谢娟英王艳娥
关键词:聚类K-MEANS算法初始聚类中心
一种新聚类评价指标被引量:11
2015年
用于发现数据集类簇数k的常用内部评价指标DB(Davies Bouldin)和BWP(Between-within Proportion)等需要先确定一个搜索范围kmax,使数据集的类簇数满足k≤kmax,但如何确定kmax尚无理论指导。针对这一问题,提出一个新F统计量Fr,将Fr作为新聚类有效性准则,以判断聚类算法收敛与否,自适应地确定数据集类簇数;将Fr应用于快速K-medoids算法的收敛性判断,并以基于最小生成树的测地距离,即样本对在最小生成树上的路径长度,代替其间的直接欧氏距离度量样本相似性,得到一种自适应的快速K-medoids聚类算法,解决了K-medoids算法需要人为给定类簇数和不能发现任意形状簇的问题。UCI机器学习数据库数据集和人工模拟数据集实验测试表明,本文提出的Fr指标是一种有效的聚类算法评价指标,基于该指标和测地距离的K-medoids算法不仅能发现任意形状的簇,还可以自适应地确定数据集的类簇数,且对噪音数据有很好的鲁棒性。
谢娟英周颖
关键词:最小生成树
基于特征子集区分度与支持向量机的特征选择算法被引量:64
2014年
考虑特征之间的相关性对于其类间区分能力的影响,提出了一种新的特征子集区分度衡量准则——DFS(Discernibility of Feature Subsets)准则.该准则考虑特征之间的相关性,通过计算特征子集中全部特征对于分类的联合贡献来判断特征子集的类间辨别能力大小,不再只考虑单个特征对于分类的贡献.结合顺序前向、顺序后向、顺序前向浮动和顺序后向浮动4种特征搜索策略,以支持向量机(Support Vector Machines,SVM)为分类工具,引导特征选择过程,得到4种基于DFS与SVM的特征选择算法.其中在顺序前/后向浮动搜索策略中,首先根据DFS准则加入/去掉特征到特征子集中,然后在浮动阶段根据所得临时SVM分类器的分类性能决定刚加入/去掉特征的去留.UCI机器学习数据库数据集的对比实验测试表明,提出的DFS准则是一种很好的特征子集类间区分能力度量准则;基于DFS与SVM的特征选择算法实现了有效的特征选择;与其他同类算法相比,基于DFS准则与SVM的特征选择算法具有非常好的泛化性能,但其所选特征子集的规模不一定是最好的.
谢娟英谢维信
关键词:支持向量机
基于统计相关性与K-means的区分基因子集选择算法被引量:56
2014年
针对高维小样本癌症基因数据集的有效区分基因子集选择难题,提出基于统计相关性和K-means的新颖混合基因选择算法实现有效区分基因子集选择.算法首先采用Pearson相关系数和Wilcoxon秩和检验计算各基因与类标的相关性,根据统计相关性原则选取与类标相关性较大的若干基因构成预选择基因子集;然后,采用K-means算法将预选择基因子集中高度相关的基因聚集到同一类簇,训练SVM分类模型,计算每一个基因的权重,从每一类簇选择一个权重最大或者采用轮盘赌思想从每一类簇选择一个得票数最多的基因作为本类簇的代表基因,各类簇的代表基因构成有效区分基因子集.将该算法与采用随机策略选择各类簇代表基因的随机基因选择算法Random,Guyon的经典基因选择算法SVM-RFE、采用顺序前向搜索策略的基因选择算法SVM-SFS进行实验比较,几个经典基因数据集上的200次重复实验的平均实验结果表明:所提出的混合基因选择算法能够选择到区分性能非常好的基因子集,建立在该区分基因子集上的分类器具有非常好的分类性能.
谢娟英高红超
关键词:相关系数秩和检验K-MEANS聚类FILTER
基于密度峰值的无监督特征选择算法被引量:4
2016年
针对现有无监督特征选择算法所选特征分类准确率不高的缺陷,提出两种新的无监督特征选择算法EDPFS(unsupervised Feature Selection algorithm based on Exponential Density Peaks)和RDPFS(unsupervised Feature Selection algorithm based on the Reciprocal Density Peaks).该两算法提出特征密度与特征距离的概念,并以此定义特征代表性与特征区分度,特征代表性越高表明特征越重要,特征区分度越高表明特征冗余度越小,以特征代表性与区分度之积作为特征重要性评价准则,采用基于特征子集的支持向量机分类正确率评价特征子集的分类性能.在8个UCI机器学习数据库数据集和4个图像数据集上测试这两种新算法,以及多类簇特征选择方法、Laplacian分值特征选择方法、无监督判别特征选择方法和扩展的无监督特征选择方法,实验结果表明:以特征代表性与区分度之积定义的特征重要性评价准则是有效的,提出的两种基于该准则的无监督特征选择算法EDPFS和RDPFS选择的特征子集具有很好的分类性能.
谢娟英屈亚楠王明钊
K近邻优化的密度峰值快速搜索聚类算法被引量:96
2016年
针对2014年6月发表在Science的密度峰值点快速搜索聚类算法的样本局部密度定义和样本分配策略的缺陷,提出一种基于K近邻的快速密度峰值搜索并高效分配样本的聚类算法.算法利用样本点的K近邻信息定义样本局部密度,搜索和发现样本的密度峰值,以峰值点样本作为初始类簇中心;提出两种基于K近邻的样本分配策略,依次分配样本到相应类簇中心,得到数据集样本的分布模式.理论分析和在经典人工数据集、UCI数据集及Olivetti人脸数据集的对比实验表明:提出的基于K近邻的密度峰值搜索聚类算法能快速发现任意形状、任意维度和任意规模数据集的类簇中心,并合理分配样本到相应类簇,揭示数据集样本的分布模式,对噪声数据具有非常好的鲁棒性,聚类结果优于2014年6月发表在Science的密度峰值点快速搜索聚类算法,以及经典聚类算法AP,DBSCAN和K-means.本文算法是一种非常有效的聚类算法,可用于发现任意数据集的隐藏模式与规律.
谢娟英高红超谢维信
关键词:K近邻聚类
共2页<12>
聚类工具0