魏藜
- 作品数:9 被引量:136H指数:2
- 供职机构:复旦大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 高维空间中的离群点发现被引量:77
- 2002年
- 在许多KDD(knowledge discovery in databases)应用中,如电子商务中的欺诈行为监测,例外情况或离群点的发现比常规知识的发现更有意义.现有的离群点发现大多是针对数值属性的,而且这些方法只能发现离群点不能对其含义进行解释.提出了一种基于超图模型的离群点(outlier)定义,这一定义既体现了“局部”的概念能很好地解释离群点的含义.同时给出了HOT(hypergraph-based outlier test)算法,通过计算每个点的支持度、隶属度和规模偏差来检测离群点.该算法既能够处理数值属性,又能够处理类别属性.分析表明,该算法能有效地发现高维空间数据中的离群点.
- 魏藜宫学庆钱卫宁周傲英
- 关键词:离群点超图模型聚类知识发现
- HOT:寻找高维空间中的离群点
- 在许多KDD(Knowledge Discovery in Databases数据库中的知识发现)应用中,如发现电子商务中的犯罪行为,发现例外情况或离群点比发现常规信息更让人感兴趣。现有的离群点发现大多是针对数值属性的,...
- 魏藜钱卫宁周傲英
- 关键词:数据挖掘离群点超图模型聚类
- 文献传递
- SLOT:基于估计的高效子空间局部离群点发现
- 1引言离群点发现(outlier detection)是数据挖掘(datamining)的一项重要技术,其目标是发现数据集中行为异常的少量数据对象,这在网络监控、金融欺诈、数据清洗等许多领域都有着很强的应用背景。对于不同...
- 魏藜钱卫宁周傲英
- 关键词:OUTLIERSUBSPACE
- 文献传递
- DEODS:快速准确的数据流密度估计
- 1引言在许多科学与商业应用中,人们都会碰到需要处理大量源源不断的数据的情况,如银行的交易信息、电信公司的电话记录、网络服务器的点击日志等。我们称这种类型的数据为数据流(data stream),它通常具有数据规模庞大,且...
- 蔡致远魏藜钱卫宁周傲英
- 文献传递
- 一个面向大规模数据库的数据挖掘系统被引量:59
- 2002年
- 数据挖掘融合了数据库技术、人工智能和统计学,是目前的研究热点.为了能够集成当前数据挖掘的主要技术并使它们协同工作,在进行数据挖掘基本算法研究的基础上研制开发了一个数据挖掘系统——Golden-Eye.系统实现了在数据挖掘研究中的一些最新成果,集成了泛化、数据清洗这两个数据准备操作以及关联规则发现、例外规则发现、时序模式发现、分类器构造、聚类分析等基本数据挖掘操作,并实现了对挖掘操作的基本管理和结果的图形化显示.整个框架设计充分体现了系统的完整性、协调性和高效性:自底向上将存储控制模块、数据预处理模块、挖掘操作模块、挖掘库管理模块有机地结合在一起,在底层实现了对包括中间结果在内的数据的统一管理,在上层为用户提供了可视化的界面.实验结果表明,该系统能够在大规模数据库上成功地完成用户所指定的数据挖掘操作.
- 钱卫宁魏藜王焱钱海蕾周傲英
- 关键词:大规模数据库数据挖掘系统数据预处理知识发现
- 我是怎样进行高三总复习的
- 1999年
- 魏藜
- 关键词:高三总复习知识点复习方法交通路线补缺工作复习计划
- 海量数据库中的小模式发现
- 该文归纳了海量数据库中小模式发现的研究现状及热点问题,并在此基础上分别对例外规则和离群点展开了研究和探索,提出了自己的定义,同时给出了适合于大规模复杂数据集的挖掘算法.具体地说,该文的贡献如下:1.提出了一种快速有效的例...
- 魏藜
- 关键词:数据挖掘离群点数据库
- 文献传递
- EDOLOIS:高效准确的子空间局部离群点发现
- 1引言越来越多的数据存放在数据库中,这使得利用这些信息并从中高效获取知识成为一种当然的需要。长期以来,人们把注意力都放到了那些识别数据集中大量对象有统一模式的方面。事实上,发现数据
- 周红福钱卫宁魏藜周傲英
- 关键词:OUTLIERSUBSPACEINNER
- 文献传递
- 基于PPM方法的中文文本压缩
- 1概述文本压缩是文本存储和传输中普遍使用的技术。目前的压缩技术大多是针对英文文本的。本文将适合于英文压缩的PPM方法进行改进,使之应用于中文文本压缩时也能取得良好的效果。2基于PPM方法的中文文本压缩
- 魏藜周水庚周傲英
- 关键词:中文文本压缩数据结构