翁小清 作品数:26 被引量:74 H指数:5 供职机构: 河北经贸大学信息技术学院 更多>> 发文基金: 国家自然科学基金 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 经济管理 理学 更多>>
基于PAA的时间序列早期分类 被引量:9 2018年 在时间序列数据挖掘领域,时间序列的早期分类越来越受到人们的重视,由于时间序列的长度(也称为维数)较大,在早期分类的实际应用中选择合适的维数约简方法非常重要,因此提出一种基于分段聚合近似(PAA)的时间序列早期分类方法。首先运用PAA对时间序列样本进行维数约简,然后在低维空间对样本进行早期分类,在43个时间序列数据集上的实验结果表明,所提方法在准确率、早期性、可靠性等方面优于已有方法。 马超红 翁小清关键词:时间序列 维数约简 基于2DSVD的多变量时间序列半监督分类 被引量:2 2019年 目前时间序列半监督分类研究主要集中在单变量时间序列,由于多变量时间序列(MTS)变量之间存在复杂关系, MTS的半监督分类研究比较少.针对这种情况,提出一种基于二维奇异值分解的MTS半监督分类方法,该方法首先计算行-行以及列-列协方差矩阵的特征向量,然后从MTS样本中提取特征矩阵;特征矩阵的行数以及列数不仅比原MTS样本低,而且还清晰地考虑了MTS样本的二维特性.在10个MTS数据集上的实验结果表明,该方法的分类性能显著地好于使用扩展Frobenius范数、中心序列、以及基于一维奇异值分解的半监督分类方法. 单中南 翁小清 马超红关键词:多变量时间序列 半监督分类 基于LPP的时间序列半监督分类 被引量:3 2019年 在时间序列研究领域,半监督分类技术越来越受到广泛关注,绝大多数现有研究都是对原始时间序列直接进行半监督分类,一般情况下,时间序列的维数(长度)比较高,在半监督分类方法中选择合适的降维技术非常重要。本文提出了一种基于局部保持投影的时间序列半监督分类方法。该方法首先使用局部保持投影对时间序列样本进行维数约减,然后对降维后的数据进行半监督分类。在15个时间序列数据集的实验结果表明,该方法的分类性能显著地好于已有方法。 单中南 翁小清 武天鸿关键词:时间序列 局部保持映射 半监督分类 数据降维 基于LDA符号表示的时间序列分类算法 被引量:6 2020年 近年来,基于符号表示的时间序列分类方法受到广泛关注,大部分现有方法对原始数据进行符号表示时,没有使用类别的标签信息。提出基于线性判别分析(LDA)的时间序列符号表示方法,考虑最大化类间区分度,使用LDA对原始数据集进行维数约减。再利用信息增益寻找降维后数据的符号投影区间,采用多重系数分箱(MCB)技术将维数约简后数据表示成符号序列。该方法在20个时间序列数据集上的分类效果好于已有方法,有监督的符号表示方法能有效提高分类性能。 武天鸿 翁小清 单中南关键词:线性判别分析 多变量时间序列聚类综述 2021年 多变量时间序列(Multivariate Time Series,MTS)具有多变量性和高冗余性,使用聚类分析从海量、高维的MTS数据中挖掘有趣模式具有重要意义。本文从基于实例、基于特征和基于模型的角度,对近年来MTS聚类方法的研究进行归类,为研究者了解最新的MTS聚类方法研究动态和发展趋势提供参考。 杨秋颖 翁小清关键词:多变量时间序列 聚类分析 维数约简 时间序列半监督分类综述 被引量:3 2018年 绝大多数现有的时间序列分类方法需要大量已标记样本,但这样的数据非常难获得且价格昂贵。因此,当已标记样本较少时,如何使用大量无标记样本来改善分类性能已成为广受关注的问题,本文对近年来时间序列半监督分类方面的研究,从基于实例、基于聚类、基于模型的角度,进行了比较归类,为了解时间序列半监督分类的技术及发展趋势提供了参考。 单中南 翁小清 马超红关键词:时间序列 半监督分类 基于邻域保持嵌入的时间序列聚类融合算法 2015年 时间序列的维数比较大,直接对时间序列进行聚类性能不理想。如何提高时间序列的聚类性能,是主要研究点。首先使用邻域保持嵌入对时间序列样本维数约简,然后对维数约简后的数据进行聚类融合,最后将它的聚类性能与已有方法如主成分分析、分段聚合近似进行比较。实验表明,所提出的算法更能提高聚类性能。 刘学 翁小清关键词:时间序列 聚类融合 维数约简 基于LLE和高斯混合模型的时间序列聚类 被引量:3 2022年 聚类分析是常见的数据挖掘方法,时间序列数据挖掘可以将海量时序信息转化成有组织的知识。由于时间序列具有高维度、非线性等特点,大多数聚类算法无法直接应用在原始时间序列数据上并取得令人满意的效果。研究如何在维数约简的同时尽可能多地保留数据的内蕴特征,识别代表知识的真正有趣的模式,具有重要意义。现有大多数时间序列聚类算法没有考虑数据集的局部结构,而数据集的局部结构对聚类性能有较大影响。提出一种基于局部线性嵌入(Locally Linear Embedding,LLE)和高斯混合模型(Gaussian Mixture Model,GMM)的时间序列聚类算法。首先从保留数据集局部结构的角度,使用LLE将每个高维时间序列样本表示为其k近邻的线性组合,并在低维空间进行重构,在保持数据集局部几何结构的同时实现维数约简;然后使用GMM从概率分布的角度进行聚类分析。与已有方法相比,该方法在单变量时间序列聚类上具有更优的效果。 杨秋颖 翁小清关键词:局部线性嵌入 高斯混合模型 流形学习 时间序列聚类 时间序列早期分类综述 被引量:10 2016年 在总结了近年来关于时间序列早期分类相关文献和相关研究进展的基础上,对参考文献中的学术观点、分类方法进行了比较归类,内容涵盖了时间序列原始数据的早期分类,时间序列早期分类的特征提取与选择、评估方法,早期分类构造模型等方面,为研究者了解最新的时间序列早期分类研究动态、新技术、发展趋势提供了参考。 马超红 翁小清关键词:时间序列 特征提取与选择 上市公司投资回报率的影响因素 被引量:4 1997年 影响证券投资者投资回报率的因素有很多,本文使用逐步回归方法从众多的因素中挑选出了对投资回报率有较大影响的因素,并建立了这些因素与投资回报率之间的数学模型。 翁小清 王培光关键词:证券信息 证券市场 上市公司 投资回报率