教育部人文社会科学研究基金(10YJCZH218)
- 作品数:3 被引量:14H指数:2
- 相关作者:张杰张杰孙曰瑶赵峰更多>>
- 相关机构:山东大学山东科技大学更多>>
- 发文基金:教育部人文社会科学研究基金山东省自然科学基金更多>>
- 相关领域:自动化与计算机技术社会学经济管理更多>>
- 基于AdaBoost组合算法的衍生金融工具风险预测被引量:12
- 2012年
- 文章构建了衍生金融工具风险预测的AdaBoost组合算法的单属性测试和决策树模型;详细论述了单属性测试和决策树与AdaBoost算法的分类器组合机制,同时界定了12个风险检测变量指标,运用252个我国上市公司作为初始样本,分别进行了一年、两年和三年的26次衍生金融工具风险预测的AdaBoost组合算法的单属性测试(SAT),AdaBoost组合算法的决策树(DT)、单决策树和单支持向量机(SVM)实验,结果表明,基于AdaBoost组合算法的衍生金融工具风险预测模型可以对公司衍生金融工具风险进有效的预测。
- 张杰张杰
- 关键词:衍生金融工具决策树支持向量机
- 基于基序及其时序关系的多变量数据流分类研究被引量:1
- 2012年
- 多变量数据流精确分类问题是当前数据挖掘与信息领域的热点和难点,引起国内外越来越多研究群体的关注,但以往的研究大多依赖于从单个流中提取特征并进行分类,没有考虑数据流内以及数据流间特征的相互依赖关系。基于此,借鉴生物信息学中基序查找的方法,提出了长期频率和逆文档频率的分类方法,该方法主要是将每个输入流都转化为符号序列来描述信号变化特征,并将符号分为长度不同的块,以便更有效地提取基序;通过计算基序的频率、长期频率与逆文档频率的权重,用以衡量不同输入多变量数据流的基序之间的时序关系,并利用了基序与时序关系实现了对多变量数据流的分类,从而确保了多变量数据流分类的准确性,仿真实验的结果也证明该方法的有效性。
- 张杰张杰赵峰
- 关键词:基序
- 数据流分类中的概念漂移转移估计方法研究被引量:6
- 2011年
- 数据流分类中的概念漂移问题是数据挖掘技术领域的前沿和难点,其重点是等级分类可能随着数据序列的转移而产生漂移现象。虽然估计动态漂移及其调整分类的算法已被提出,但现有算法由于目标分布例证的缺失在概念漂移估计方面的表现并不是很好,例证的多少严重影响了估计效果。鉴此,提出了一种新的参数估计方法,称为转移估计法,运用目标分布数据,结合相似分布理论,对现存的算法进行改进,以便实现对数据流分类中的概念漂移现象进行正确检测和估计。通过对虚拟和真实数据集的仿真实验表明,改进算法在数据流分类中的概念漂移估计方面优于现存算法。
- 张杰张杰
- 关键词:数据流概念漂移数据挖掘