王莉莉
- 作品数:11 被引量:41H指数:4
- 供职机构:中国科学院成都计算机应用研究所更多>>
- 发文基金:四川省科技支撑计划中国科学院西部之光基金更多>>
- 相关领域:自动化与计算机技术自然科学总论一般工业技术更多>>
- 基于标签相关性的多标签分类AdaBoost算法被引量:4
- 2016年
- 在多标签分类问题中,标签之间往往是相关的,为了提高分类性能,利用标签之间的相关性,提出AdaBoost.MLR算法和标签相关性分析方法。AdaBoost.MLR算法采用余弦相似度来计算标签相关性矩阵,利用标签相关性矩阵对原始标签矩阵进行补全转换为模糊标签矩阵,将标签空间划分为标签集、标签相关集和标签无关集,结合标签之间的相关性和弱分类器的分类情况,对样本权重进行调整。AdaBoost.MLR算法也能解决多类别分类问题,在其标签相关性的计算中,根据已经训练的弱分类器得到的临时强分类器的分类结果,构造标签相似性矩阵。实验结果表明,文中提出的算法在实验数据集上优于现有的算法,尤其在标签相关性复杂的数据集上分类性能有显著提升。
- 王莉莉付忠良
- 关键词:多分类问题ADABOOST算法分类器组合
- 基于浮动阈值分类器组合的多标签分类算法被引量:9
- 2015年
- 针对目标可以同时属于多个类别的多标签分类问题,提出了一种基于浮动阈值分类器组合的多标签分类算法。首先,分析探讨了基于浮动阈值分类器的Ada Boost算法(Ada Boost.FT)的原理及错误率估计,证明了该算法能克服固定分段阈值分类器对分类边界附近点分类不稳定的缺点从而提高分类准确率;然后,采用二分类(BR)方法将该单标签学习算法应用于多标签分类问题,得到基于浮动阈值分类器组合的多标签分类方法,即多标签Ada Boost.FT。实验结果表明,所提算法的平均分类精度在Emotions数据集上比Ada Boost.MH、ML-k NN、Rank SVM这3种算法分别提高约4%、8%、11%;在Scene、Yeast数据集上仅比Rank SVM低约3%、1%。由实验分析可知,在不同类别标记之间基本没有关联关系或标签数目较少的数据集上,该算法均能得到较好的分类效果。
- 张丹普付忠良王莉莉李昕
- 关键词:连续ADABOOST
- 空间金字塔分解的深度可视化方法被引量:2
- 2017年
- 针对基于深度卷积神经网络的图像分类模型的可解释性问题,通过评估模型特征空间的潜在可表示性,提出一种用于改善理解模型特征空间的可视化方法.给定任何已训练的深度卷积网络模型,所提出的方法在依据原输入图像使得模型类别得分激活最大化时,首先对反向传播的梯度进行归一化操作,然后采用带动量的随机梯度上升训练策略,反向回传修改原输入图像.引入了通过激活最大化获得的图像可解释性的正则化方法,常规正则化技术不能主动调整模型特征空间的潜在可表示性,结合现有正则化方法提出空间金字塔分解方法,利用构建多层拉普拉斯金字塔主动提升目标图像特征空间的低频分量,结合多层高斯金字塔调整其特征空间的高频分量得到较优可视化效果.通过限制可视化区域,提出利用类别显著性激活图技术加以压制上下文无关信息,可进一步改善可视化效果.对模型学习到的不同类别和卷积层中单独的神经元进行合成可视化实验,实验结果表明提出的方法在不同的深度模型和不同的可视化任务中均能取得较优的可视化效果.
- 陶攀付忠良付忠良王莉莉
- 关键词:金字塔分解卷积神经网络
- 基于双标签集的标签匹配集成学习算法
- 2014年
- 当标识示例的两个标签分别来源于两个标签集时,这种多标签分类问题称之为标签匹配问题,目前还没有针对标签匹配问题的学习算法。尽管可以用传统的多标签分类学习算法来解决标签匹配问题,但显然标签匹配问题有其自身特殊性。通过对标签匹配问题进行深入的研究,在连续AdaBoost(real Adaptive Boosting)算法的基础上,基于整体优化的思想,采用算法适应的方法,提出了基于双标签集的标签匹配集成学习算法,该算法能够较好地学习到标签匹配规律从而完成标签匹配。实验结果表明,与传统的多标签学习算法用于解决标签匹配问题相比,提出的新算法不仅缩小了搜索的标签空间的范围,而且最小化学习误差可以随着分类器个数的增加而降低,进而使得标签匹配分类更加快速、准确。
- 张丹普王莉莉付忠良李昕
- 关键词:连续ADABOOST
- 基于多分类AdaBoost改进算法的TEE标准切面分类被引量:1
- 2017年
- 针对超声图像样本冗余、不同标准切面因疾病导致的高度相似性、感兴趣区域定位不准确问题,提出一种结合特征袋(BOF)特征、主动学习方法和多分类AdaBoost改进算法的经食管超声心动图(TEE)标准切面分类方法。首先采用BOF方法对超声图像进行描述;然后采用主动学习方法选择对分类器最有价值的样本作为训练集;最后,在AdaBoost算法对弱分类器的迭代训练中,根据临时强分类器的分类情况调整样本更新规则,实现对多分类AdaBoost算法的改进和TEE标准切面的分类。在TEE数据集和三个UCI数据集上的实验表明,相比AdaBoost.SAMME算法、多分类支持向量机(SVM)算法、BP神经网络和AdaBoost.M2算法,所提算法在各个数据集上的G-mean指标、整体分类准确率和大多数类别分类准确率都有不同程度的提升,且比较难分的类别分类准确率提升最为显著。实验结果表明,在包含类间相似样本的数据集上,分类器的性能有显著提升。
- 王莉莉付忠良陶攀朱锴
- 基于深度学习的医学计算机辅助检测方法研究被引量:5
- 2018年
- 针对自动检测医学图像中指定目标时存在的问题,提出了一种基于深度学习自动检测目标位置和估计对象姿态的算法。该算法基于区域深度卷积神经网络和目标结构的先验知识,采用区域生成候选框网络、感兴趣区域池化策略,引入包括分类损失、边框位置回归定位损失和像平面内朝向损失的多任务损失函数,近似优化一个端到端的有监督定位网络,能快速地对医学图像中目标自动定位,有效地为下一步的分割和参数自动提取提供定位结果。并在超声心动图左心室检测中提出利用检测额外标记点(二尖瓣环、心内膜垫和心尖),能高效地对左心室朝向姿态进行估计。为了验证算法的鲁棒性和有效性,实验数据选取经食管超声心动图和核磁共振图像。实验结果表明算法是快速、精确和有效的。
- 陶攀付忠良付忠良朱锴
- 关键词:计算机辅助检测核磁共振图像超声心动图
- 基于Ranking Loss的多标签分类集成学习算法被引量:1
- 2013年
- 针对目标可以属于多个类别的多标签分类问题,提出了一种基于Ranking Loss最小化的集成学习方法。算法基于Real AdaBoost算法的核心思想,从Ranking Loss定义出发,以Ranking Loss在样本空间最小化为目标,采取迭代的方法训练多个弱分类器,并将这些弱分类器集成起来构成强分类器,强分类器的Ranking Loss随着弱分类器个数的增加而逐渐减少,并给出了算法流程。通过理论分析和实验数据对比验证了提出的多标签分类算法的有效性和稳定性。
- 任志博王莉莉付忠良张丹普杨燕霞
- 关键词:ADABOOST算法分类器组合
- 基于主动学习不平衡多分类AdaBoost算法的心脏病分类被引量:10
- 2017年
- 针对不平衡分类中小类样本识别率低问题,提出一种基于主动学习不平衡多分类Ada Boost改进算法。首先,利用主动学习方法通过多次迭代抽样,选取少量的、对分类器最有价值的样本作为训练集;然后,基于不确定性动态间隔的样本选择策略,降低训练集的不平衡性;最后,利用代价敏感方法对多分类Ada Boost算法进行改进,对不同的类别给予不同的错分代价,调整样本权重更新速度,强迫弱分类器"关注"小类样本。在临床经胸超声心动图(TTE)测量数据集上的实验分析表明:与多分类支持向量机(SVM)相比,心脏病总体识别率提升了5.9%,G-mean指标提升了18.2%,瓣膜病(VHD)识别率提升了0.8%,感染性心内膜炎(IE)(小类)识别率提升了12.7%,冠心病(CAD)(小类)识别率提升了79.73%;与SMOTE-Boost相比,总体识别率提升了6.11%,G-mean指标提升了0.64%,VHD识别率提升了11.07%,先心病(CHD)识别率提升了3.69%。在TTE数据集和4个UCI数据集上的实验结果表明,该算法在不平稳多分类时能有效提高小类样本识别率,并且保证其他类别识别率不会大幅度降低,综合提升分类器性能。
- 王莉莉付忠良陶攀胡鑫
- 关键词:BOOST多类别分类
- 基于深度学习的超声心动图切面识别方法被引量:4
- 2017年
- 提出了一种基于深度卷积神经网络自动识别超声心动图标准切面的方法,并可视化分析了深度模型的有效性。针对网络全连接层占有模型大部分参数的缺点,引入空间金字塔均值池层化替代全连接层,获得更多空间结构信息,并大大减少模型参数、降低过拟合风险,通过类别显著性区域将类似注意力机制引入模型可视化过程。通过超声心动图标准切面的识别问题案例,对深度卷积神经网络模型的鲁棒性和有效性进行解释。在超声心动图上的可视化分析实验表明,改进深度模型作出的识别决策依据,同医师辨别分类超声心动图标准切面的依据一致,表明所提方法的有效性和实用性。
- 陶攀付忠良朱锴王莉莉
- 关键词:超声心动图可视化卷积神经网络
- 基于模糊多标签AdaBoost算法的心脏瓣膜疾病分类
- 2017年
- 针对心脏瓣膜疾病模糊分类问题,提出基于多标签Ada Boost的模糊分类改进算法。结合模糊集理论,采用隶属函数将疾病的严重程度映射到区间[0,1]内的实数值,将超声诊断结果用模糊标签向量表示。利用余弦相似性分析疾病之间的复杂关系,计算标签相关性矩阵并对模糊标签向量进行补充。结合实际问题选取合适的阈值,将标签空间划分为标签集、标签相关集和标签无关集。本文算法以最小化排序损失为目标,针对不同的标签给予不同的权值调整因子,调整样本权重更新速度,强迫弱分类器关注与样本标签相关性较高的标签。在临床超声心动图(TTE)测量数据集上的实验结果表明:在对超声诊断结果模糊化时,通过隶属函数将疾病严重程度中的"无病"映射为0,"轻度"映射到区间[0.8,0.85],"中度"映射到区间[0.85,0.9],"重度"映射到区间[0.9,1],构造模糊标签矩阵,并通过标签相关性矩阵对其进行补充,此时所构造的分类器性能达到最优。将本文算法与Ada Boost.MLR算法、Ada Boost.MR算法、BPMLL算法、Rank SVM算法和ML-KNN算法进行对比分析,在多标签分类的5种评价指标上,本文算法的分类性能均优于其他对比算法,分类结果更接近超声诊断结果。
- 王莉莉付忠良
- 关键词:瓣膜疾病ADA