韩鹏
- 作品数:1 被引量:5H指数:1
- 供职机构:河南省国家税务局更多>>
- 发文基金:河南省教育厅科学技术研究重点项目国家自然科学基金河南省基础与前沿技术研究计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于SAX方法的时间序列分类问题的多阶段改进研究被引量:5
- 2016年
- 分类问题是数据挖掘中的基本问题之一,时间序列的特征表示及相似性度量是时间序列数据挖掘中分类、聚类及模式发现等任务的基础。SAX方法是一种典型的时间序列符号化表示方法,在采用该方法的基础上对时间序列进行分类,不仅可以有效地降维、降噪,而且具有简单、直观等特点,但是该方法有可能造成信息损失并影响到分类结果的准确性。为了弥补信息损失对分类结果的影响,采用了集成学习中大多数投票方法来弥补BOP表示后的信息损失,从而提高整个分类器的效率。针对一些样本在BOP表示中都损失了相似的重要信息,以至于大多数投票无法进一步提高分类效率的问题,进一步提出了结合集成学习中AdaBoost算法,通过对训练样本权重的调整,从而达到以提高分类器性能来弥补信息损失的效果。实验结果表明,将BOP方法与集成学习相结合的方法框架,不仅能很好地处理SAX符号化表示中的信息损失问题,而且与已有方法相比,在分类准确度方面也有显著的提高。
- 宋伟张帆叶阳东韩鹏范明
- 关键词:时间序列SAX