蒋晓云
- 作品数:4 被引量:14H指数:2
- 供职机构:中国矿业大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于数值型和分类型混合属性数据集的聚类算法研究
- 介绍了数值型和分类型属性的概念以及处理分类型属性的方法,详细探讨了一种处理分类型和数值型的混合型属性数据集的算法(k-pmtotypes);在此算法的基础上,提出了一种基于分组选择法确定初始点的改进算法;并使用实际数据集...
- 曹露燕蒋晓云孟凡荣
- 关键词:数值型聚类算法
- 文献传递
- 基于主成分分析的决策树构造方法被引量:7
- 2008年
- 针对传统的ID3算法在选择分裂属性上对取值较多属性过分依赖的缺点,提出了基于主成分分析的决策树优化算法.该算法是通过主成分分析综合了信息增益和相关度系数来选择分裂属性.论文通过UCI提供的标准数据集,对优化算法进行测试,分析了优化算法的性能特点,验证了优化算法在分类正确率和执行效率上要优于ID3算法.
- 孟凡荣蒋晓云田恬施蕾申丽君
- 关键词:决策树ID3主成分分析
- 煤矿系统数据挖掘模型的研究与设计被引量:7
- 2006年
- 随着煤矿生产系统信息化、集成化程度的提高,对矿山多源异构数据挖掘系统的研究已成为矿山生产、研究部门共同关注的问题。在分析数据挖掘通用模型以及煤矿数据特点的基础上,以XML作为一种异构数据挖掘的标准,提出了一种煤矿数据挖掘系统原型架构。整个系统模型包括数据获取模块、XML隧道、数据挖掘模块和基于XML的知识表达模块,对各个模块的功能以及XML文档与数据库之间互相转换的关键技术进行了深入的研究探讨。
- 曹露燕孟凡荣蒋晓云
- 关键词:煤矿数据挖掘可扩展标记语言数据库
- 基于数值型和分类型混合属性数据集的聚类算法研究
- 介绍了数值型和分类型属性的概念以及处理分类型属性的方法,详细探讨了一种处理分类型和数值型的混合型属性数据集的算法(k-prototypes);在此算法的基础上,提出了一种基于分组选择法确定初始点的改进算法;并使用实际数据...
- 曹露燕蒋晓云孟凡荣
- 文献传递