您的位置: 专家智库 > >

刁力力

作品数:11 被引量:143H指数:4
供职机构:清华大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术天文地球理学经济管理更多>>

文献类型

  • 8篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 11篇自动化与计算...
  • 1篇经济管理
  • 1篇天文地球
  • 1篇理学

主题

  • 5篇数据挖掘
  • 4篇BOOSTI...
  • 2篇信息处理
  • 2篇人工智能
  • 2篇文本分类
  • 2篇文本挖掘
  • 2篇MAS
  • 1篇信息处理系统
  • 1篇学习算法
  • 1篇英文
  • 1篇知识发现
  • 1篇智能体
  • 1篇神经网
  • 1篇神经网络
  • 1篇数据库
  • 1篇资源共享
  • 1篇文本
  • 1篇现代信息
  • 1篇向量
  • 1篇向量空间

机构

  • 9篇清华大学
  • 2篇北方交通大学
  • 2篇重庆三峡学院
  • 1篇烟台大学

作者

  • 11篇刁力力
  • 8篇陆玉昌
  • 5篇石纯一
  • 4篇胡可云
  • 2篇鲁明羽
  • 2篇涂承胜
  • 1篇黄厚宽
  • 1篇王丽坤

传媒

  • 4篇计算机科学
  • 1篇清华大学学报...
  • 1篇软件学报
  • 1篇北方交通大学...
  • 1篇铁路计算机应...
  • 1篇第7届中国机...
  • 1篇第三届全球智...

年份

  • 3篇2003
  • 2篇2002
  • 2篇2001
  • 2篇2000
  • 1篇1998
  • 1篇1996
11 条 记 录,以下是 1-10
排序方式:
计算文本相似度阈值的方法被引量:29
2003年
基于VSM(向量空间模型)的相似度分类器的相似度阈值通常由经验确定导致分类精度不高。该文提出一种基于Boosting机制在不同文档集上自动计算相似度阈值的方法。它利用Boosting迭代生成多个基于相似度划分的子分类器,通过加权把决定这些子分类器的相似度阈值组合起来,得到对理想相似度阈值的一种逼近。实验表明:这样得到的相似度分类器的平均精度比传统方法高15%左右,甚至可以与一些复杂方法相比。它在处理网络实时文本信息处理问题(分类、过滤和检索)中的效率是这些复杂方法的3倍以上,且问题规模越大、越复杂,其优势越大。
刁力力王丽坤陆玉昌石纯一
关键词:数据挖掘文本挖掘文本分类向量空间模型计算方法
bagging及其与Boosting的比较
Breiman的Bagging和Freund及Schapire的Boosting是最新的提高预测学习系统预测能力的方法,二者都建立了通过投票结合起来的预测器集合。该文对Breiman提出的Bagging理论作了较为详细的...
刁力力胡可云陆玉昌石纯一
关键词:MARGIN数据挖掘
文献传递
用Boosting方法组合增强Stumps进行文本分类(英文)被引量:41
2002年
为提高文本分类的精度,Schapire和Singer尝试了一个用Boosting来组合仅有一个划分的简单决策树(Stumps)的方法.其基学习器的划分是由某个特定词项是否在待分类文档中出现决定的.这样的基学习器明显太弱,造成最后组合成的Boosting分类器精度不够理想,而且需要的迭代次数很大,因而效率很低.针对这个问题,提出由文档中所有词项来决定基学习器划分以增强基学习器分类能力的方法.它把以VSM表示的文档与类代表向量之间的相似度和某特定阈值的大小关系作为基学习器划分的标准.同时,为提高算法的收敛速度,在类代表向量的计算过程中动态引入Boosting分配给各学习样本的权重.实验结果表明,这种方法提高了用Boosting组合Stump分类器进行文本分类的性能(精度和效率),而且问题规模越大,效果越明显.
刁力力胡可云陆玉昌石纯一
关键词:BOOSTING方法文本分类
Boosting组合学习方法及其在文本挖掘中的应用研究
目前Boosting方法己在数据挖掘的多个领域特别是在文本挖掘中得到了成功的应用.该文致力于解决在Boosting的理论和实际应用方面出现的一些问题,以提高其分类精度和学习速度,增强其实用性.该文的主要研究工作包括:(1...
刁力力
关键词:数据挖掘文本挖掘
UNIX环境下资源共享的研究
1996年
本文对在UNIX环境下进行网络编程,实现资源共享作了初步探讨,并以打印机为代表的外设资源共享作为具体例子来加以实现。采取两种不同方案编程:基于NFS下硬盘共享实现和基于TCP流套接字实现。
宋泽雨刁力力
关键词:资源共享UNIX
用人工智能和神经网络的方法组建数据压缩系统被引量:2
1998年
数据压缩是现代信息处理的基础课题之一.文中对数据压缩的设计思路作了分析和拓展,从系统的角度对数据压缩与人工智能、神经网络的结合作了一些大胆的、初步的尝试,并对这个研究方向作了一些功能上和性能上的分析,提出了再压缩的概念.
刁力力黄厚宽
关键词:人工智能神经网络BP算法
用ODIIPSA98设计人机集成研讨体系的计算机支持环境
ODIIPSA98(Open Dstrbuted Intellgent Informaton Processng System Archtecture '98)是作者提出的一种实用的、面向包括多媒体和知识信息在内的多种信...
刁力力陆玉昌
关键词:经济决策信息处理数据挖掘MAS智能体
文献传递
基于MAS设计现代信息处理系统:思路与探讨被引量:1
2001年
This paper discusses the ideas for designing modern information processing system,in which we emphasize the observation about the advantages and disadvantages while designing large-scale open system using MAS theory. After brief review and analysis about the study situations or limitations of present information processing techniques and DAI/MAS,this paper discusses many problems in the combination between MAS and information processing. Finally,a brand new MAS organization structural model and new ideas for devising information processing systems are put forward with the consideration about the limitations of MAS' organization structure and the strong requirements of feasibility and efficiency.
刁力力胡可云陆玉昌石纯一
关键词:信息处理系统MASINTERNET人工智能
Boosting家族Boost-by-majority系列代表算法被引量:4
2003年
1 引言 Boosting由Freund和Schapire于1990年提出,是提高预测学习系统预测能力的有效工具,也是组合学习中最具代表性的方法,其代表算法可分为Boost-by-majority和AdaBoost两个系列。Boosting操纵训练例子以产生多个假设。从而建立通过投票结合的预测器集合。Boosting在训练例子上维护一套概率分布。
涂承胜刁力力鲁明羽陆玉昌
关键词:BOOSTING算法
数据挖掘与组合学习被引量:22
2001年
Data-mining is a kind of solution for solving the problem of information exploding. Classification and prediction belong to the most fundamental tasks in data-mining field. Many experiments have showed that the results of ensemble of learning methods are generally better than those of single learning methods under most of the time. In the sense,it is of great value to introduce ensemble of learning methods to data mining. This paper introduces data mining and ensemble of learning methods respectively,along with the analysis and formulation about the role ensemble of learning methods can act in some important practicing aspects of data mining:Text mining,multi-media information mining and web mining.
刁力力胡可云陆玉昌石纯一
关键词:数据挖掘数据库知识发现
共2页<12>
聚类工具0