舒平达
- 作品数:5 被引量:2H指数:1
- 供职机构:宁波大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种提高文本检索准确性的关联方法
- 2010年
- 文本检索就是从文本集中发现与用户查询相关的文本的过程。传统的基于查询似然检索模型没有考虑词项之间内在关系和外在共现关系。针对这些缺点,分别提出新关联方法分别予以解决。最后,通过实验对比证明新方法在查询精度上有了明显的提高,验证了新方法的有效性。
- 施侃晟刘海涛舒平达
- 关键词:文本检索统计语言模型
- 数据流上频繁模式挖掘研究
- 近年来,随着一些新型应用的出现,如网络监控、传感器网络等,越来越多的数据以流的形式出现。人们自然希望借助数据挖掘的技术来对数据流进行处理,以便发现数据中潜在的价值。如何从数据流中发现频繁模式,已成为当前研究的一个热点。
...
- 舒平达
- 关键词:数据挖掘数据流频繁项集
- 文献传递
- 支持多时间粒度的数据流上最频繁K项挖掘被引量:1
- 2009年
- 数据流最频繁K项挖掘是指在数据流中找出K个项,它们的支持数大于数据流中的其他项.已有的一些算法只能挖掘整个数据流的频繁K项,而无法找出距离最近的任意时间段内的最频繁K项.因此,提出一种基于多层概要结构的数据流最频繁K项挖掘算法MMF(K)_MS,新算法利用各层节点数目可变的HFVN框架结构来支持对不同时间粒度的查询,同时采用Count-Sketch数据结构来维护各层的概要信息,并通过实验验证了算法的有效性.
- 舒平达陈华辉
- 关键词:数据流数据挖掘
- 数据流概要结构管理研究
- 陈华辉陈叶芳李荣茜舒平达
- 随着计算机网络和各类电子设备应用的越来越广泛,越来越多的数据以流的形式出现,如网络路由信息,传感器网络采集的实时信号,证券交易、信用卡交易、商场购物交易等的实时记录,因特网网站点击流,电信网络的电话呼叫业务记录,聊天室、...
- 关键词:
- 关键词:数据库
- 数据流上最近频繁项集挖掘算法被引量:1
- 2009年
- 数据流频繁项集挖掘是指在数据流中找出出现频数大于给定的最小支持度的项集过程。随着一些新兴应用如传感器网络、网络监控等的出现,数据流中频繁项集挖掘引起了很大的重视。提出了一种新颖的数据流频繁项集挖掘算法RFIF。不同于现有算法,RFIF算法针对现实中的一些实际应用,更多的考虑最近时间发生的事件,但也不完全抛弃历史数据,通过引入GIMT函数,逐渐加大项集支持度的阈值,减少对历史数据中频繁项集的维护。实验验证了算法的有效性。
- 舒平达陈华辉
- 关键词:数据流数据挖掘频繁项集