国家自然科学基金(61371196) 作品数:38 被引量:154 H指数:7 相关作者: 刁兴春 曹建军 刘艺 高科 郑奇斌 更多>> 相关机构: 国防科技大学 解放军理工大学 总参第六十三研究所 更多>> 发文基金: 国家自然科学基金 中国博士后科学基金 国家科技重大专项 更多>> 相关领域: 自动化与计算机技术 兵器科学与技术 军事 自然科学总论 更多>>
基于蚁群参数优化的LightGBM辐射源个体识别 被引量:5 2023年 为提升辐射源个体识别正确率和运算效率,提出了一种基于蚁群参数优化的LightGBM辐射源个体识别方法。运用提升小波包变换对辐射源信号数据进行特征提取并构建特征参数体系,对得到的特征数据集进行Z-score标准化处理;以最大分类正确率和最小特征子集规模为目标,建立了LightGBM参数优化和特征选择的数学模型;采用蚁群算法优化LightGBM的6个参数(最小叶子节点数据量、决策树的数量、学习率、L_(1)正则化项的权重、L_(2)正则化项的权重和最小叶子节点样本权重和);根据优化后的LightGBM得到每个特征的重要性值并使用序列后向搜索策略进行特征选择;最后通过LightGBM分类器实现对辐射源信号的分类识别。实验结果表明,所提方法在无噪声、信噪比为10 dB和信噪比为5 dB信号的数据集上的识别正确率优于对比特征选择方法GBDT、XGBoost和LightGBM的,同时特征维数的减少也提升了辐射源个体识别的运算效率。 顾楚梅 曹建军 王保卫 徐雨芯关键词:辐射源个体识别 蚁群算法 基于胶囊网络的文本数据真值发现 被引量:1 2023年 为解决传统真值发现算法无法提取文本数据关键语义信息的问题,提出一种基于胶囊网络的文本数据真值发现算法(Truth Discovery of Text Data Based on Capsule Network,Caps-Truth),对传统卷积神经网络(Convolutional Neural Network,CNN)进行改进,在神经网络模型中构造语义胶囊层替代CNN池化层表征文本语义信息。首先通过CNN卷积层获取文本数据全局特征,利用初级胶囊层将特征信息向量化,再通过语义胶囊层表征文本数据细粒度语义信息,将特征向量输入全连接神经网络挖掘文本数据可信度并获得可靠答案。上述算法在真值发现中引入胶囊网络,利用动态路由算法整合零散语义,有效提高了文本数据真值发现的效果。实验结果表明,Caps-Truth算法优于对比算法。 陶嘉庆 樊树海 曹建军 常宸关键词:数据质量 神经网络 文本数据 基于常量条件函数依赖的冲突消解算法 2020年 目前绝大部分冲突消解方法都是基于迭代计算数据源可靠度和事实可信度的机制。当数据源较少时,数据源的可靠度难于进行评估,仅凭投票来消解冲突往往会造成较大误差。针对数据源较少时的冲突消解问题,提出基于常量条件函数依赖的冲突消解算法。根据多个数据源之间的冲突,找出冲突匹配对及对应的冲突候选值集合。考虑常量条件函数依赖中具体到部分实例子集的约束关系,将常量条件函数依赖集作为先验知识,通过判断候选值是否符合常量条件函数依赖来选择正确的候选值,避免了错误数据比例较大时直接投票选择产生的误差。通过两个真实数据集上的对比实验验证了上述算法的有效性。 冯钦 曹建军 郑奇斌 张磊关键词:数据清洗 数据质量 数据冲突 冲突消解 多目标蚁群优化研究综述 被引量:11 2017年 多目标蚁群优化是一类重要的多目标进化算法,它在解决多目标优化问题,尤其是多目标组合优化方面,具有优异的性能。首先,通过总结多目标蚁群优化的研究成果,将多目标蚁群优化分为基于帕累托的方法、基于指标函数的方法和目标分解法3类,并阐述了每类方法的特点和代表性算法;然后,展现了多目标蚁群优化在实际问题中的广泛应用;最后,探讨了目前多目标蚁群优化存在的问题。 刁兴春 刘艺 曹建军 尚玉玲关键词:多目标进化算法 帕累托优化 结合关键帧提取的视频-文本跨模态实体分辨双重编码方法 被引量:1 2022年 现有的视频-文本跨模态实体分辨方法在视频处理上均采用均匀取帧的方法,必然导致视频信息的丢失,增加问题的复杂度。针对这一问题,提出一种结合关键帧提取的视频-文本跨模态实体分辨双重编码方法(DEIKFE)。以充分保留视频信息表征为前提,设计关键帧提取算法提取视频中的关键帧,获得视频关键帧集合表示。对于视频关键帧集合和文本,采用多级编码的方法,分别提取表征视频和文本的全局、局部和时序的特征,将其进行拼接形成多级编码表示。将该编码表示映射至共同嵌入空间,采用强负样本跨模态三元组损失对模型参数进行优化,使得匹配的视频-文本相似度越大,而不匹配的视频-文本相似度越小。通过在MSR-VTT、VATEX两个数据集上进行实验验证,与现有方法进行对比,在总体性能R@sum上分别提升了9.22%、2.86%,证明了该方法的优越性。 曾志贤 曹建军 翁年凤 蒋国权 范强关键词:关键帧提取 面向大规模定制的制造业领域数据溯源模型研究 被引量:1 2023年 数据溯源技术与大规模定制生产模式的融合是实现数据质量提高和技术创新发展的基础。基于订单随机性、产品种类多、批量少给数据质量带来的一系列的机遇和挑战,提出一种基于开放溯源模型的数据溯源模型。结合大规模定制中数据生命周期的特点,从海量的数据中寻找源头数据及记录数据在传播过程中的变化来对其进行管理,构建大规模定制下制造业领域的数据溯源信息交换模型。建立供应链开放溯源模型、产品属性开放溯源模型和生产阶段开放溯源模型,从而解决大规模定制中企业之间或企业内部的信息交换问题,实现数据追踪功能和数据质量的控制与提升。 徐滨 翁年凤 樊树海 权政关键词:大规模定制 生命周期管理 基于集成分类的高维数据实体分辨 被引量:3 2018年 针对高维数据实体识别问题,为了有效利用高维特征的富信息,提高分辨性能,提出一种随机组合集成分类器。定义基分类器的分类性能指标,将分类正确性和特征子集的个数作为设计基分类器两个目标,使用聚合函数将其转换为单目标优化问题。采用蚁群优化求解基分类器模型,提出利用最大信息系数度量特征的相关性作为蚁群优化启发式信息,使用谷元距离度量选择特征多样性差异最大的基分类器组合集成分类器,集成分类器的决策函数采用投票表决输出。在标准数据集上进行验证与对比,结果表明了该方法的有效性。 刘艺 刁兴春 曹建军 尚玉玲关键词:高维数据 集成分类器 蚁群优化 挖掘机构别名的Jaccard相似度数据空间转换方法 2018年 针对同一机构实体对应多个机构名称的问题,提出了一种基于Jaccard相似度数据空间转换的机构别名挖掘方法。根据机构与作者间的隶属关系,建立机构-作者二部图模型;采用Jaccard相似度度量两机构名称所对应作者姓名集合间的相似度;根据机构间的相似度矩阵,将集合型数据转换成数值型数据;通过计算机构名称对应的相似度向量间的余弦相似度,实现了机构别名的有效挖掘。最后用真实数据进行对比实验验证了该方法的优越性。 尚玉玲 曹建军 李红梅 刘艺关键词:余弦相似度 求解子集问题的鲶鱼效应蝙蝠蚁群优化 被引量:5 2016年 为求解子集问题,提出一种新的基于图的蚂蚁系统——鲶鱼效应蝙蝠蚁群优化(catfish bat algorithm-ant colony optimization,CBA-ACO)。基于子集问题的构造图,利用路径概率转移公式进行路径搜索,采用等效路径信息素增强进行信息素更新;动态维护一定数量较好路径作为档案信息;使用混沌映射并结合鲶鱼效应对蝙蝠算法(bat algorithm,BA)进行改进,在全局最优解多次未更新时,利用档案信息初始化鲶鱼效应增强搜索,返回较好路径解;采用本轮迭代最优更新和增强搜索更新两种方式更新信息素,兼顾算法的收敛速度和搜索能力。对算法进行了描述并分析算法复杂度。结果表明,CBA-ACO具有更好的稳定性和获取较好解的能力。 刘艺 刁兴春 曹建军 丁鲲 许永平关键词:鲶鱼效应 混沌映射 一种引入冗余控制的特征排序模型 2016年 针对特征排序方法较少考虑特征之间的相关关系,导致选择的特征子集存在冗余的问题,提出一种引入冗余控制的特征排序模型。将特征子集判别能力最大且冗余程度最小作为模型的目标函数,以降低特征之间的冗余;使用贪心方法和非线性规划方法对模型进行求解。在9个开源数据上的实验及与特征排序方法比较表明,本模型在大部分数据上,所选择的特征子集能够获得更好的分类准确性且个数更少;使用非线性规划方法求解时,能够直接得到特征子集,有利于确定特征个数。本模型可用于特征之间存在冗余时的特征选择。 周星 刁兴春 曹建军关键词:非线性规划