国家自然科学基金(61070089) 作品数:10 被引量:183 H指数:4 相关作者: 王淑琴 张璐 王珺 卫金茂 郑陶然 更多>> 相关机构: 天津师范大学 南开大学 天津工业大学 更多>> 发文基金: 国家自然科学基金 天津市应用基础与前沿技术研究计划 天津市科技计划 更多>> 相关领域: 自动化与计算机技术 轻工技术与工程 建筑科学 文学 更多>>
分类器评价指标MCC、CEN和ACC的比较研究 被引量:2 2020年 准确率ACC、Matthews相关系数MCC和混淆熵CEN是在多类问题上应用比较广泛的分类器评价指标,本文对这3种指标进行比较研究.使用6种常见的分类器对UCI数据库中12个基准数据集进行处理,分析了3种指标值变化趋势的关系,并从一致性和判别性角度对3种指标进行了比较,实验结果表明,CEN具有更好的性能. 张冰 刘林 王淑琴 田秀伟关键词:CEN MCC ACC 基于子类问题分类能力度量的特征选择方法 2018年 特征选择是机器学习领域中的基本问题之一,在大规模数据处理中至关重要.目前大多数特征选择方法以单一值作为特征的分类能力评价标准,本文提出基于子类问题分类能力的特征选择方法,该方法用特征对各子类问题的分类能力及其加权平均值来度量特征的分类能力,既能保证总分类能力强的特征被选择,也能保证对子类问题分类能力强但总分类能力不强的特征被选择.将该方法与已有的3个特征选择方法在4个公开的基因表达数据集上进行比较,结果表明该方法是有效的,且可以提高分类预测准确率. 刘磊 郑陶然 赵晨飞 刘林 王淑琴 何茂伟基于互信息与判别结构互补的特征选择 被引量:2 2021年 提出一种基于子问题分类能力的特征选择算法,利用互信息度量特征对子问题的分类能力,根据特征的判别结构互补确定目标特征子集.该算法既会选择总分类能力强的特征,也会选择子问题分类能力强的特征.将该算法与已有的6个特征选择算法在6个公开的数据集上进行比较实验,结果表明,所提算法的性能优于其他特征选择算法. 张开翔 李双杰 王小刚 李雅丽 陈倩茹 王淑琴关键词:互信息 移动端古诗词学习系统 被引量:1 2022年 移动互联网的发展使移动端知识获取模式成为时代的新宠,诗词亦是中华文化的璀璨明珠,诗词学习与移动学习的联合已迫在眉睫.本系统使用Client/Server(客户/服务器)结构,由Faster R-CNN实现图像识别,再通过循环神经网络模型(RNN)完成古诗生成功能,最后根据协同过滤推荐算法完成个性化推荐.客户端APP以Flutter,SpringBoot框架为基础开发,数据库采用了MySQL关系型数据库管理系统进行数据管理,结合服务器与系统进行连接进而实现所需功能.面向对诗词学习存在需求及抱有浓厚兴趣的人群,开发出一个致力于传承发扬中华文化,结合图像识别与深度学习技术以实现智能识图与古诗生成的诗词学习系统. 罗璐莹 李婧妍 丁思文 李兆发 王梦琴 晏嘉俊 吴文娟 王淑琴关键词:RNN 基于混淆熵的分类器集成方法 2023年 本文提出了一种基于混淆熵(confusion entropy,CEN)的分类器集成算法.该算法按照候选分类器的CEN值升序排序,遍历选择使得CEN值减小的分类器,从而使组合不断优化,以获得更好的集成分类结果.使用7个候选分类器在5个UCI数据集上进行实验,结果表明,所提算法整体上优于经典的分类器集成算法AdaBoost和XGBoost以及另外3种近期算法(AdaCost、AdaCost-CNN和CU-AdaCost),验证了算法的可行性. 陈浩 任晓莹 李彦宏 薛佳炜 王淑琴 崔玥关键词:分类器集成 混淆矩阵 基于保留分类信息的多任务特征学习算法 被引量:4 2017年 在模式识别中,特征选择是一种非常有效的降维技术.特征评价标准在特征选择过程中被用于度量特征的重要性,但目前已有的标准存在着只考虑类之间的分离性而未考虑其相关性、无法去除特征之间的分类冗余性以及多用于单变量度量而无法获取子集整体最优性等问题.提出一种保留分类信息的特征评价准则(classification information preserving,CIP),并使用多任务学习技术进行实现.CIP是一种特征子集度量方法,通过F范数实现已选特征子集的分类信息与原始数据分类信息的差异最小化,并通过l2,1范数约束选择特征个数.近似交替方向法被用于求解CIP的最优解.理论分析与实验结果表明:CIP选择的最优特征子集不仅最大程度上保留了原始数据类别之间的相关性信息,而且有效地降低了特征之间的分类冗余性. 王珺 卫金茂 张璐关键词:多任务学习 若干新型群智能优化算法的对比研究 被引量:155 2020年 随着计算机技术的发展,算法技术也在不断交替更新。近年来,群体智能算法受到了广泛的关注和研究,并在诸如机器学习、过程控制、工程预测等领域取得了进展。群智能优化算法属于生物启发式方法,广泛应用在解决最优化问题上,传统的群智能算法为解决一些实际问题提供了新思路,但是也在一些实验中暴露出不足。近年来,许多学者相继提出了很多新型群智能优化算法,选取了最近几年国内外提出的比较典型的群智能算法,蝙蝠算法(Bat Algorithm,BA)、灰狼优化算法(Grey Wolf Optimization,GWO)、蜻蜓算法(Dragonfly Algorithm,DA)、鲸鱼优化算法(Whale Optimization Algorithm,WOA)、蝗虫优化算法(Grasshopper Optimization Algorithm,GOA)和麻雀搜索算法(Sparrow Search Algorithm,SSA),并进一步通过22个标准的CEC测试函数从收敛速度、精度和稳定性等方面对比了这些算法的实验性能,并对比分析了其相关的改进方法。最后总结了群智能优化算法的特点,探讨了其今后的发展潜力。 李雅丽 王淑琴 陈倩茹 王小钢基于加权K近邻的特征选择方法 被引量:5 2020年 提出一种基于属性和距离加权的K近邻特征选择方法.该方法在计算样本类别时既考虑每个特征的重要程度,又考虑近邻样本的距离,使用遗传算法搜索最优特征权重向量.将该方法与已有的3种特征选择方法MIFS、DISR和CIFE在6个公开的数据集上进行比较,实验结果表明该方法是有效的,且可以提高分类性能. 李双杰 张开翔 王士栋 王淑琴关键词:K近邻 遗传算法 实数编码 自调优自适应遗传算法的WKNN特征选择方法 被引量:8 2021年 针对大多已有基于K近邻和遗传算法的特征选择方法中没有考虑各个特征的重要度不同,并且容易出现过早收敛,特别是局部最优解问题,提出了一种基于自调优自适应遗传算法的WKNN特征选择方法。该方法使用WKNN算法预测样本的类别,为每个特征分配一个权重来衡量特征的分类能力,然后采用自调优自适应遗传算法,对变异率、种群规模和收敛阈值进行参数调整,在迭代进化过程中搜索最优特征权重向量。为了评价该方法的有效性,与已有7种特征选择方法在5个标准数据集上进行了比较。实验结果表明,该方法是有效的,且具有较高的分类性能。 陈倩茹 李雅丽 许科全 刘铱龙 王淑琴关键词:实数编码 基于深度学习的安全帽监管系统 被引量:6 2021年 在工程现场因不佩戴安全帽导致的悲剧时有发生,为了协助工程现场管理人员保障工人的人身安全,本文设计实现了一种基于深度学习的安全帽智能监管系统.该系统采用集速度和精度为一体的YOLOv4目标检测模型,在数据集上使用K-means算法聚类分析生成新的先验框,并使用新的先验框进行训练,将安全帽的检测精度提高至92%;将检测模型YOLOv4与跟踪模型DeepSORT相结合,有效解决重复警告和无法对违规数据进行统计的问题;最终制作成跨平台移动APP,方便管理人员使用移动端随时随地监管安全帽佩戴情况.本系统是一套集安全帽检测、检测视频实时直播、智能警告、违规图片抓取并展示,违规数据可视化等功能为一体的安全帽智能监管系统,它的使用能够大大提高工程现场的生产安全系数和监管效率. 郑晓 王淑琴 张文聪 郑京瑞 周游关键词:K-MEANS算法