原继东
- 作品数:30 被引量:146H指数:8
- 供职机构:北京交通大学更多>>
- 发文基金:国家自然科学基金北京市自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术交通运输工程建筑科学农业科学更多>>
- 基于趋势信息的时间序列分类方法被引量:3
- 2019年
- 大部分时间序列数据分析的一个重要组成部分是相似性度量方式.在众多相似性度量方式中,基于最长公共子序列的相似性度量方式是一种常用的有效方法,但该方法仅仅度量序列点对点的数值差异,而忽略了序列的变化趋势.为此提出一种基于趋势信息的时间序列离散化方法并用最长公共子序列进行相似性度量.该方法能够很好地度量时间序列的趋势信息.此外,还将其与现有的点对点函数线性结合.与现有相似性度量方法不同,该方法能同时考虑时间序列的趋势信息和函数距离,相似性度量方案运用最近邻分类算法规则进行分类.为了进行全面的比较,在42个时间序列数据集上测试该算法的有效性.实验结果表明,所提出的方法能有效提高时间序列分类准确率.
- 林钱洪王志海原继东张伟
- 关键词:时间序列
- 时间序列的表示与分类算法综述被引量:52
- 2015年
- 时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内,依照给定的采样率,对某种潜在过程进行观测的结果。时间序列数据广泛地存在于商业、农业、气象、生物科学以及生态学等诸多领域,从时间序列中发现有用的知识已成为数据挖掘领域的研究热点之一。在时间序列表示方面,主要介绍了非数据适应性表示方法、数据适应性表示方法和基于模型的表示方法;针对时间序列的分类方法,着重介绍了基于时域相似性、形状相似性和变化相似性的分类算法,并对未来的研究方向进行了进一步的展望。
- 原继东王志海
- 关键词:时间序列
- 基于多维随机森林的番茄灰霉病高光谱图像早期检测被引量:2
- 2022年
- 植物病害的自动早期检测对于作物精确保护至关重要。提出了一种基于多维光谱序列(multi-dimensional spectral series,MDSS)和加权随机森林(weighted random forest,WRF)的番茄灰霉病早期诊断与鉴别方法。目的是利用叶片多个观测维度的光谱曲线整体变化趋势建立作物病害检测模型,以期在肉眼明显可见叶面病斑前对作物病害实现诊断。将健康叶片接种灰霉病菌第3天作为叶片成功染病第1天。试验首先采集番茄健康叶片和染病叶片7天内每天的高光谱图像,提取感兴趣区域并计算平均光谱作为初始光谱数据,经筛选共得到(156×7)组有效样本。将样本数据按时间顺序拆分成分别包含1~7个维度的光谱数据形成多维原始光谱序列,为增加维度间差异性,相邻原始光谱序列相减构成多维关联光谱序列。分别采用符号聚合近似估计(symbolic aggregate approximation,SAX)和符号傅里叶近似估计(symbolic Fourier approximation,SFA)两种符号化方法将光谱序列离散成局部辨别性特征。基于多维光谱序列的局部辨别性特征建立加权随机森林(MDSS-SAX-SFA-WRF)分类模型,实现病害早期检测。相应地,基于单维光谱序列(single-dimensional spectral series,SDSS)的番茄灰霉病识别模型被作为基准模型与MDSS-SAX-SFA-WRF模型比较。试验结果显示,MDSS-SAX-SFA-WRF检测模型在包含2至7个光谱序列维度的56个测试样本数据中均获得90%以上识别准确率,在包含5个光谱序列维度测试集中得到最高99%的识别准确率,较SDSS-SAX-SFA-MRF检测模型在染病第5天的识别率高8.2个百分点。另外受随机干扰的影响,SDSS-SAX-SFA-MRF模型准确率在染病5~7 d出现大幅度回落至最低84%,MDSS-SAX-SFA-WRF模型识别率在肉眼可见病斑阶段依然保持超过98%的较高检测水准,未过度回落。因此,提出的基于多维光谱曲线整体变化趋势和加权随机森林(MDSS-SAX-SFA-WRF)的分类模型能够有效实
- 高荣华高荣华张月原继东原继东吴华瑞
- 关键词:番茄灰霉病
- 一种基于Shapelets的懒惰式时间序列分类算法被引量:9
- 2019年
- 近些年,时间序列分类问题研究受到了越来越多的关注.基于shapelets的时间序列分类技术是一种有效的方法.然而,其在提取最优shapelet的过程中要建立包含大量冗余元素的候选shapelets集合,一般所获得的shapelets只在平均意义上具有某种鉴别性;与此同时,普通模型往往忽略了待分类实例所具有的局部特征.为此,我们提出了一种依据待分类实例显著局部特征的懒惰式分类模型.这种模型为每个待分类实例构建各自的数据驱动的懒惰式shapelets分类模型,从而逐步缩小了与其分类相关的时间序列搜索空间,使得所获得的shapelets能够直接反映待分类实例的显著局部特征.实验结果表明该文提出的模型具有较高的准确率和更强的可解释性.
- 王志海张伟原继东刘海洋
- 关键词:时间序列可解释性
- 土体级配图像自动拍摄系统
- 本发明是一种用于机器学习样本采集的海量土体级配图像自动拍摄装置,包涵摄像系统、滚筒和固定支座。固定支座侧壁上有连接摄像系统的连接杆,固定支座上有两个支架支撑滚筒。滚筒的转轴中空其中安置拍摄装置,试验土样通过加料口进入装置...
- 李旭罗鸣吉浩泽李茂彪王玉杰赵宇飞武雷杰姚敏原继东刘欢
- 文献传递
- 一种基于TBM实时破岩数据的软弱破碎围岩感知方法
- 本发明提供了一种基于TBM实时破岩数据的软弱破碎围岩感知方法。该方法将已有数据划分为软弱破碎围岩数据集和非软弱破碎围岩数据集。首先,利用重合度的概念计算了破岩指标(TPI、FPI、WR和AF)在两个数据集上的划分阈值;其...
- 李旭武雷杰李锦辉李建斌王玉杰王双敬王琳刘立鹏原继东
- 数据流滑动窗口方式下的自适应集成分类算法被引量:4
- 2016年
- 针对基于数据块的集成算法,存在数据块大小影响分类效果,且不能及时应对完整式概念漂移的问题,提出了一种考虑数据流局部特征的和能应对多种类型概念漂移的集成分类算法.用滑动窗口作为概念漂移检测器,当检测到概念漂移时,则建立新的分类器并加入到集成分类器中.本文提出的算法在人工合成和真实数据集上与经典算法进行了广泛的对比实验.结果表明:提出的算法在分类准确率上具有明显优势,消耗更少的内存,更适合多种类型概念漂移的环境.
- 孙艳歌王志海原继东韩萌
- 关键词:数据挖掘数据流概念漂移集成分类器
- 一种隧道掘进响应参数的预测方法
- 本发明提供了一种隧道掘进响应参数的预测方法。该方法包括:筛选符合条件的隧道掘进数据集,构建基于卷积神经网络的掘进响应参数的线预测模型,选取设定的隧道掘进的上升段和稳定段行为样本分别作为线预测模型的输入参数和输出参数,对掘...
- 李旭姚敏陈祖煜原继东王玉杰武雷杰兴海叶明何金星吴根生
- 基于逻辑shapelets转换的时间序列分类算法被引量:12
- 2015年
- 时间序列shapelets是序列之中最具有辨别性的子序列.解决时间序列分类问题的有效途径之一是通过shapelets转换技术,将其发现与分类器的构建相分离,其主要优点是优化了shapelets的选择过程并能够灵活应用不同的分类策略.但此方法也存在不足,仅仅简单地应用这些shapelets而忽略它们之间的逻辑组合关系,有可能降低分类的效果;另外,离线式的发现shapelets的过程是相当耗时的.文中针对后一个问题,采用了一种基于智能缓存的计算重用技术,将发现shapelets的时间复杂度降低了一个数量级.在此基础上,作者提出了一种基于合取或析取的逻辑shapelets转换方法,并通过在多个经典的基准数据集上测试,表明了该方法能够在提升分类准确性的同时保持shapelets所具有的解释力.
- 原继东王志海韩萌游洋
- 关键词:时间序列
- 一种基于机器学习的TBM新建工程数据增强方法
- 本发明提供了一种基于机器学习的TBM新建工程数据增强方法。该方法包括对历史工程和新建工程TBM循环段中关键破岩参数数据进行数据清洗;对历史工程清洗后的TBM关键破岩参数采用转换不变量进行转换;将经过转换不变量转换后的历史...
- 李旭李海波王玉杰王双敬李建斌武雷杰荆留杰李鹏宇原继东