国家自然科学基金(61170130)
- 作品数:10 被引量:21H指数:3
- 相关作者:孙浩军高玉龙袁婷张磊李惊涛更多>>
- 相关机构:汕头大学信息技术有限公司更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术政治法律更多>>
- 一种高维分类型数据的子空间聚类算法
- 2014年
- 子空间聚类是一种将搜索局部化在相关维上进行的聚类算法,它能有效地克服数据因维度过高引起的在全空间上聚类的困难.针对高维分类型数据,本文提出了一种自底向上的子空间层次聚类算法,该算法在全局范围内建立一个最相似线性表用来记录每个簇类与其最相似的簇类的相似度,在聚类过程中,选取最相似的簇类合并,并通过维护此线性表产生最相似的簇类.此算法在基于信息熵的意义上能够较准确地搜索簇类的子空间.通过Zoo和Soybean两个典型的分类型数据实验发现,相对于其它相关聚类算法,该算法在聚类的准确率和稳定性方面表现出较高的优越性.
- 孙浩军李惊涛张磊张崇锐肖婷
- 关键词:子空间聚类高维信息熵
- 基于粗糙集的高维分类型数据子空间聚类算法
- 2012年
- 现有的优秀的聚类算法大多是处理低维数据的,但是对于高维数据,由于其分布特性与低维情形有很大的差异,这些算法失效.为解决高维分类型数据聚类问题,提出了一种基于粗糙集的高维分类型数据子空间聚类算法,基于粗糙集的上、下近似集的类边界描述,确定了类边界范围,然后采用相容度来调整类边界,聚类的过程采用增长子空间的思想,从低维到高维迭代地搜子空间类簇.最后通过在soybean、zoo数据集上的对比实验,实验结果表明了算法不仅可行,而且精度高.
- 孙浩军游俊斌吴廷发
- 关键词:粗糙集聚类
- 基层公共服务平台行政审批系统被引量:2
- 2016年
- 基层电子公共服务平台行政审批是政府部门运用现代信息技术为企业和基层群众提供服务的一种新型运作模式。本文分析了公共服务平台行政审批体系,设计并实现了在基层综合政务信息共享平台。通过队用户和管理者的角度详细分析了业务流程,特别是对多部门的协同审批方面,提出了完善的业务模型,对行政审批一体化平台中的网上审批大厅进行分析与设计,实现了入口统一、功能完善、高效快捷、安全可靠的"一站式"行政审批平台。
- 林叙鸿孙浩军
- 关键词:公共服务平台事务管理
- 基于熵权法的混合属性聚类算法被引量:5
- 2013年
- K-prototypes算法是处理混合数据的主要聚类算法,大部分针对混合型数据的聚类算法都是选择数据集中的一部分数据作为聚类对象,而忽略了这类数据的特殊性与整体性,为了改进了数据的距离衡量,文中提出了一种新的聚类方法,该方法采用信息熵作为属性的权值,进行高精度和更加稳定的聚类,最后通过Matlab编程实现,采用uci数据集中credit等数据集进行仿真实验,证明改进算法是正确和有效的.
- 孙浩军高玉龙闪光辉袁婷
- 关键词:混合数据信息熵
- 一种高维混合属性数据聚类算法被引量:6
- 2015年
- 在许多应用中,很多数据集都具有数值型和分类型数据的混合特征,k-prototype是针对这类数据聚类的经典方法之一,该方法是一种基于k-means和k-mode的聚类方法。在研究了现有的混合属性数据聚类方法之后,引入了一种新算法用于混合型数据聚类,不仅改进了prototype的选取方法,而且提出了一种新的针对混合型数据的相似度度量方式,基于此又提出了一种不同于k-prototype的数据到prototype的分配方式,采用类似层次聚类中凝聚聚类的思想进行聚类,通过在四个真实的混合型数据集上测试发现:与传统算法相比,算法提高了聚类的精度和稳定性。
- 孙浩军闪光辉高玉龙袁婷
- 关键词:聚类相似度计算层次聚类
- 基层(区县级)公共服务平台系统设计与实现
- 2016年
- 电子政务是政府部门运用现代信息技术为企业和公众提供服务的一种新型运作模式。笔者分析了政务信息资源体系,设计并实现了基层综合政务信息共享平台。通过信息资源共享目录、信息资源共享交换、共享数据查询等系统,较好地实现了政府各部门之间信息共享。
- 孙浩军林丽玲林叙鸿
- 关键词:公共服务平台数据共享数据查询
- 高维分类型数据加权子空间聚类算法被引量:2
- 2014年
- 子空间聚类是高维数据聚类的一种有效手段,子空间聚类的原理就是在最大限度地保留原始数据信息的同时用尽可能小的子空间对数据聚类。在研究了现有的子空间聚类的基础上,引入了一种新的子空间的搜索方式,它结合簇类大小和信息熵计算子空间维的权重,进一步用子空间的特征向量计算簇类的相似度。该算法采用类似层次聚类中凝聚层次聚类的思想进行聚类,克服了单用信息熵或传统相似度的缺点。通过在Zoo、Votes、Soybean三个典型分类型数据集上进行测试发现:与其他算法相比,该算法不仅提高了聚类精度,而且具有很高的稳定性。
- 孙浩军闪光辉高玉龙袁婷吴云霞
- 关键词:高维数据聚类子空间信息熵层次聚类
- 基于互信息与贝叶斯信念网络的关系层次距离混合聚类算法被引量:1
- 2018年
- 聚类是数据挖掘中重要的功能算法,其主要的功能是发现数据中潜在的知识.目前文献发表的聚类算法多数仅限于处理单一数值型数据或者分类型数据,其主要原因是含有多种类型的混合型数据间的相似性很难度量.本文提出了一种混合数据相似性度量方法:对于分类型属性,利用互信息构建贝叶斯信念网络,利用贝叶斯信念网络构建关系层次,继而为层次附上距离,形成关系层次距离,而对于数值型属性则利用标准化的曼哈顿距离来度量其相似性,最后结合分类型属性与数值型属性来对整个数据集进行相似性的度量.在此基础上,设计实现了用于混合型数据聚类算法CRHD,并通过UCI中的多个数据集和已有算法进行仿真实验对比,证明了CRHD算法的有效性.
- 蔡金成孙浩军
- 关键词:聚类混合数据互信息贝叶斯信念网络
- 新音形编码汉字输入法设计被引量:5
- 2014年
- 针对当前汉字输入法普遍存在的不足,提出了一种新音形编码汉字输入法,即利用汉字的首拼音、韵母及组成汉字的基本笔画和少数高频部件来对汉字编码,是对以前笔画和音形编码汉字输入法的改进。它既有笔画输入法低重码率、输入高效的特点,又切合广大拼音输入法用户的输入习惯,能够很好地满足多种用户群的需求。阐述了这种编码输入法对汉字的编码规则,对各编码的按键分布及重码率进行详实的统计,深入分析论证了其重码率低的优点,简要介绍了这种输入法在Android平台下的实现。
- 陈钦梧彭小忠
- 关键词:汉字输入法
- 基于小波分析和Gaussian回归的急性低血压预测
- 2016年
- 急性低血压是危害病人健康的并发症之一,对急性低血压发生的提早预测,能够帮助医生对重症病人找到更好的医疗处理方案。提出了一个基于趋势分量的Gaussian函数拟合预测模型,即用小波多尺度分析提取出信号的趋势分量;再根据Gaussian回归模型对趋势分量进行函数拟合,得到的函数参数作为特征值,用支持向量机SVM对数据分类。Gaussian回归模型使用的是数据驱动,用系数来描述数据之间的关系。通过在较大病人数据集上实验得到了较好的效果。
- 孙浩军张崇锐张磊李惊涛
- 关键词:小波多尺度分析函数拟合数据驱动