国家自然科学基金(61373093) 作品数:6 被引量:15 H指数:2 相关作者: 张莉 李凡长 王邦军 夏佩佩 陶志伟 更多>> 相关机构: 苏州大学 江苏省计算机信息处理技术重点实验室 更多>> 发文基金: 国家自然科学基金 江苏省高校自然科学研究项目 江苏省自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
基于马氏距离的分段矢量量化时间序列分类 被引量:2 2016年 提出一种基于马氏距离的分段矢量量化时间序列分类(Mahalanobis distance-based time series classification using PVQA,M PVQA)算法。该算法在继承传统算法时间复杂度的基础上,引入马氏距离,克服了欧氏距离容易受模式特征量纲影响的缺点,提高了算法精度。首先,在训练时采用分段矢量量化近似方法获得码本,然后以马氏距离为相似性度量对时间序列进行分段重构。对重构后的时间序列,同样基于马氏距离为相似性度量进行判别。在4个时间序列数据集上进行的试验结果验证了所提方法在时间序列表示和分类上的优越性。 陶志伟 张莉关键词:时间序列 码本 欧氏距离 基于属性约简和支持向量机集成的乳腺癌诊断决策 被引量:3 2015年 针对遗传算法(GA)与支持向量机(SVM)集成相结合的疾病诊断方法存在属性冗余的问题,提出了一种改进的约简和诊断乳腺癌决策方法。该方法将最小化约简属性个数、最大化区分矩阵可区别属性的个数以及最大化约简属性对决策属性的依赖度这三种目标函数相结合作为GA的适应度函数。在约简属性后取多个子集,以便利用SVM集成学习。在UCI数据库中乳腺癌数据集的实验表明,与原始的SVM算法相比,该方法在分类诊断的准确度以及敏感性方面有一定的提高,其中分类准确度至少提高了2%。 卢星凝 张莉关键词:粗糙集 支持向量机 属性约简 乳腺癌诊断 遗传算法 基于单核苷酸统计和支持向量机集成的人类基因启动子识别 被引量:1 2015年 为高效地判别人类基因启动子,提出了一种基于单核苷酸统计和支持向量机集成的人类基因启动子识别算法。首先通过基因单核苷酸统计,从而将一个基因数据集分为C偏好和G偏好两个子集;然后分别对这两个子集提取DNA刚性特征、词频统计特征和Cp G岛特征;最后采用多个支持向量机(SVM)集成的方式来学习这三种特征,并讨论了三种集成方式,包括单层SVM集成、双层SVM集成和级联SVM集成。实验结果表明所提算法能够提高人类基因启动子识别的敏感性和特异性,其中双层SVM集成的敏感性达到79.51%,且级联SVM集成的特异性高达84.58%。 徐文轩 张莉关键词:CPG岛 KL散度 支持向量机 局部平衡的判别近邻嵌入算法 被引量:1 2014年 判别近邻嵌入算法(discriminant neighborhood embedding,DNE)通过构造邻接图,使得在投影子空间中能够保持原始数据的局部结构,能有效地发现最佳判别方向。但是它有两方面的不足:一方面不能标识样本点的近邻样本点位置信息,从而不能更好地保持邻域结构;另一方面当数据不均衡时,不能实现子空间中类内聚合或者类间分离的目的,这不利于分类。为此提出了一种新的有监督子空间学习算法——局部平衡的判别近邻嵌入算法(locality-balanced DNE,LBDNE)。在构建邻接图时,局部平衡的判别近邻嵌入算法分别建立同类邻接图和异类邻接图,并通过引入一个控制参数,有效地平衡了类内与类间的关系。该算法与其他经典算法相比,在人脸识别问题上具有较高的识别率,充分说明了局部平衡的判别近邻嵌入算法能够有效地处理识别问题。 丁春涛 张莉 王邦军关键词:邻接图 人脸识别 基于余弦相似性的供应商选择方法 被引量:8 2017年 提出一种基于余弦相似性的改进TOPSIS(technique for order preference by similarity to ideal solution)法并将其应用于解决供应商选择的问题。夹角余弦的距离度量方式隐含了传统TOPSIS法中属性权重,提高了决策的客观性。在供应商选择的实例上证明了所提方法有较强的科学性和合理性。 张莉 夏佩佩 李凡长关键词:TOPSIS 供应商选择 多属性决策 欧氏距离 基于稀疏字典的李群机器学习算法 2020年 李群机器学习理论被广泛应用于图像集分类中的数据表示和处理,并获得较优结果.由此,文中提出基于稀疏字典的李群机器学习算法.首先使用协方差矩阵对图像集建模,分析协方差矩阵构成的李群结构,应用对数映射将数据映射到线性空间中,得到数据的距离矩阵.再使用路标多维缩放对数据进行降维处理,降低运算成本.最后,使用带费舍尔判别字典学习进行分类.在YTC数据集上的实验证明文中算法具有良好的鲁棒性和准确率. 熊啸东 李凡长 王邦军 梁合兰关键词:李群机器学习