您的位置: 专家智库 > >

胡可云

作品数:12 被引量:508H指数:7
供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家教育部博士点基金更多>>
相关领域:自动化与计算机技术理学天文地球更多>>

文献类型

  • 9篇期刊文章
  • 2篇学位论文
  • 1篇会议论文

领域

  • 11篇自动化与计算...
  • 2篇理学
  • 1篇天文地球

主题

  • 7篇知识发现
  • 4篇数据库
  • 4篇数据挖掘
  • 3篇人工智能
  • 3篇概念格
  • 3篇粗糙集
  • 2篇知识发现系统
  • 2篇数据库知识发...
  • 2篇GALOIS...
  • 2篇粗糙集合
  • 1篇信息处理
  • 1篇信息处理系统
  • 1篇英文
  • 1篇数据分析
  • 1篇文本分类
  • 1篇现代信息
  • 1篇剪枝
  • 1篇关联规则
  • 1篇ROUGH
  • 1篇ROUGHS...

机构

  • 7篇清华大学
  • 5篇合肥工业大学

作者

  • 12篇胡可云
  • 6篇石纯一
  • 6篇陆玉昌
  • 4篇王志海
  • 4篇刁力力
  • 3篇胡学钢
  • 3篇张奠成
  • 2篇徐本柱
  • 2篇刘宗田

传媒

  • 2篇合肥工业大学...
  • 2篇软件学报
  • 2篇计算机科学
  • 1篇模式识别与人...
  • 1篇清华大学学报...
  • 1篇计算机学报
  • 1篇第7届中国机...

年份

  • 1篇2002
  • 3篇2001
  • 3篇2000
  • 1篇1999
  • 4篇1998
12 条 记 录,以下是 1-10
排序方式:
bagging及其与Boosting的比较
Breiman的Bagging和Freund及Schapire的Boosting是最新的提高预测学习系统预测能力的方法,二者都建立了通过投票结合起来的预测器集合。该文对Breiman提出的Bagging理论作了较为详细的...
刁力力胡可云陆玉昌石纯一
关键词:MARGIN数据挖掘
文献传递
用Boosting方法组合增强Stumps进行文本分类(英文)被引量:41
2002年
为提高文本分类的精度,Schapire和Singer尝试了一个用Boosting来组合仅有一个划分的简单决策树(Stumps)的方法.其基学习器的划分是由某个特定词项是否在待分类文档中出现决定的.这样的基学习器明显太弱,造成最后组合成的Boosting分类器精度不够理想,而且需要的迭代次数很大,因而效率很低.针对这个问题,提出由文档中所有词项来决定基学习器划分以增强基学习器分类能力的方法.它把以VSM表示的文档与类代表向量之间的相似度和某特定阈值的大小关系作为基学习器划分的标准.同时,为提高算法的收敛速度,在类代表向量的计算过程中动态引入Boosting分配给各学习样本的权重.实验结果表明,这种方法提高了用Boosting组合Stump分类器进行文本分类的性能(精度和效率),而且问题规模越大,效果越明显.
刁力力胡可云陆玉昌石纯一
关键词:BOOSTING方法文本分类
基于粗糙集合理论的知识发现综述被引量:32
1998年
粗糙集合理论是一种新的处理模糊和不确定性的数学工具,它已经应用于机器学习、知识发现、决策支持系统和模式识别等领域.本文阐述了粗糙集合理论的基本思想与特点,介绍了知识发现的一般过程.重点评述了基于粗糙集合理论的知识发现方法,介绍了几个基于粗糙集合理论的典型系统.
王志海胡可云胡学钢徐本柱刘宗田张奠成
关键词:粗糙集合知识发现人工智能
剪枝 Galois 格上规则的直接计算被引量:4
1998年
Galois格用于知识发现具有许多优点,并在实际应用中显示了一定的价值。现提出一种在已剪枝的Galois格上直接计算规则的算法,其主要依据格结点的直接泛化来产生规则集合。该算法在一定条件下更为有效,并且所产生的规则集合是无冗余的。文中所述方法已用于数据库知识发现工具HUTKDD中。
王志海胡学钢胡可云张奠成
关键词:GALOIS格数据库知识发现人工智能剪枝
基于概念格和粗糙集的数据挖掘方法研究
胡可云
关键词:知识发现数据挖掘粗糙集概念格
概念格上规则提取的一般算法与渐进式算法被引量:112
1999年
许多研究表明概念格是数据分析与规则提取的一种有效工具.本文首先提出一种在对象与描述符数目较多、概念聚类具有一定规模条件下,在已建造好的概念格上有效地提取规则的算法.这种方法主要依据格结点的直接泛化来产生相应无冗余规则;然后改进了一种渐进式更新概念格与相应Hasse图的算法,并将之应用于渐进式提取规则.目前,这些方法已用于我们所开发的数据库知识发现工具原型系统中.
王志海胡可云胡学钢刘宗田张奠成
关键词:概念格GALOIS格知识发现数据库
基于 Rough Set 的知识发现系统被引量:7
1998年
RoughSet理论是近年来出现的处理模糊和不确定性的数学工具,已广泛应用于人工智能的许多领域特别是KDD领域。文章介绍了RoughSet理论的基本思想,并着重讨论了几个基于RoughSet理论的典型KDD系统。
胡可云王志海徐本柱
关键词:ROUGHSET知识发现数据库知识发现
基于粗糙集合的知识发现系统开发与研究
随着数据库的不断增长,自动从数据库中获取有用的知识成为人们日益迫切的需要.粗糙集合理论凭借其独特的优势而在KDD领域中具有越来越重要的地位.该文在对粗糙集合及其相关理论的研究基础上,设计了一个基于粗糙集合理论的知识发现原...
胡可云
关键词:粗糙集合知识发现KDD系统
概念格及其应用进展被引量:160
2000年
概念格是近年来获得飞速发展的数据分析的有力工具。从数据集中生成概念格的过程实质上是一种概念聚类过程。然而 ,概念格可以用于许多机器学习的任务 ,例如分类 ,关联规则的挖掘等。论文介绍了概念格的基本概念 ,讨论了现有的几种建格算法和在格上提取规则的方法及相关系统和应用。另外 ,还介绍了格的剪枝及概念格和另一个新型数据分析工具粗糙集之间的关系。
胡可云陆玉昌石纯一
关键词:概念格数据分析
数据挖掘与组合学习被引量:22
2001年
Data-mining is a kind of solution for solving the problem of information exploding. Classification and prediction belong to the most fundamental tasks in data-mining field. Many experiments have showed that the results of ensemble of learning methods are generally better than those of single learning methods under most of the time. In the sense,it is of great value to introduce ensemble of learning methods to data mining. This paper introduces data mining and ensemble of learning methods respectively,along with the analysis and formulation about the role ensemble of learning methods can act in some important practicing aspects of data mining:Text mining,multi-media information mining and web mining.
刁力力胡可云陆玉昌石纯一
关键词:数据挖掘数据库知识发现
共2页<12>
聚类工具0