您的位置: 专家智库 > >

国家自然科学基金(70471006)

作品数:2 被引量:4H指数:1
相关作者:刘红岩陈海亮杜小勇杨慧何军更多>>
相关机构:清华大学中国人民大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇会议论文
  • 1篇期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇数据流
  • 2篇数据流挖掘
  • 2篇频繁模式挖掘
  • 2篇频繁模式挖掘...
  • 2篇模式挖掘算法
  • 1篇中冷
  • 1篇数字图
  • 1篇数字图书馆
  • 1篇图书
  • 1篇图书馆
  • 1篇协同过滤
  • 1篇个性化推荐

机构

  • 3篇中国人民大学
  • 2篇清华大学

作者

  • 2篇杨慧
  • 2篇刘红岩
  • 1篇何军
  • 1篇罗喜军
  • 1篇杜小勇

传媒

  • 1篇计算机研究与...

年份

  • 3篇2007
2 条 记 录,以下是 1-3
排序方式:
一种面向高速度数据流的频繁模式挖掘算法
数据流频繁模式挖掘是从实时、连续、有序的数据序列中寻找频繁模式的过程,以往的相关研究通常将该过程分为两个阶段:首先监测数据流中各模式的频率,由于数据流环境对空间与时间的限制,需要对监测模式进行剪裁,因而频率的计算和剪裁需...
杨慧刘红岩何军杜小勇
关键词:数据流数据流挖掘频繁模式挖掘
文献传递
基于类别的推荐——一种解决协同推荐中冷启动问题的方法
个性化推荐系统的目标是推荐最合适的资源给最需要的用户,这种推荐多数是基于用户的一些历史行为而做出的.如果有足够的历史记录,协同过滤推荐方法往往比其他推荐方法要好.然而协同过滤方法存在严重的冷启动问题,即当有新的用户、新的...
罗喜军王韬丞杜小勇刘红岩何军
关键词:个性化推荐数字图书馆协同过滤
文献传递
一种面向高速度数据流的频繁模式挖掘算法
2007年
数据流频繁模式挖掘是从实时、连续、有序的数据序列中寻找频繁模式的过程,以往的相关研究通常将该过程分为两个阶段:首先监测数据流中各模式的频率,由于数据流环境对空间与时间的限制,需要对监测模式进行剪裁,因而频率的计算和剪裁需要重复进行;当用户提交查询时,从监控的模式中筛选出满足要求的输出.现有研究都注重解决如何对观测对象进行剪裁,而事实上在计算模式频率时,数据项集中不同数据项间的组合使得频率计算非常耗时.因此,对于高速数据流,算法通常没有足够的时间来处理数据流中的每个事务,这会影响挖掘结果的正确性.针对这一问题提出了一种新的面向高速数据流的频繁模式挖掘算法Delay. 在Delay算法中将模式频率的统计延迟到第2阶段进行,第1阶段只记录"必要信息",这样大大提高了算法所能处理的数据流流动速度的上限.实验结果表明,算法在效率上优于已有算法,LossyCounting和FDPM,尤其是在处理长数据项集数据流时优势更为明显.
杨慧刘红岩何军杜小勇
关键词:数据流数据流挖掘频繁模式挖掘
共1页<1>
聚类工具0