刘敏 作品数:19 被引量:77 H指数:6 供职机构: 湖北工业大学电气与电子工程学院 更多>> 发文基金: 国家自然科学基金 湖北省自然科学基金 国家留学基金 更多>> 相关领域: 自动化与计算机技术 环境科学与工程 电子电信 更多>>
基于MD-LinkNet的低质量文档图像二值化算法 被引量:2 2019年 针对低质量文档图像存在的背景渗透、页面污渍、边缘大面积与文本相似的噪声等现象,改进D-LinkNet框架,提出了一种融合多尺度特征(multiple scale feature)的低质量文档图像二值化算法,简称为MD-LinkNet。该算法有两处改进,一是在编解码中间部分增加剩余多核池化(RMP)模块来通过四个池化操作以提取丰富的文档特征信息;二是将池化后的低分辨率图像通过DUpsample而不是双线性插值进行上采样,结合了文档图像像素邻域信息,将文档图像的全局与局部特征进行融合,提高了分割精度。实验结果表明,在2017年和2018年国际文档图像二值化竞赛(DIBCO)数据集中,本文算法的F值(F-measure)最高分别达到了90.54、91.42,验证了所提出算法在解决多种复杂噪声背景的低质量文档图像下的鲁棒性,且相比其他最新经典算法效果较优。 熊炜 贾锈闳 金靖熠 王娟 王娟 刘敏基于特征跟踪和网格路径运动的视频稳像算法 被引量:8 2020年 针对手持移动设备拍摄的抖动视频问题,提出了一种基于特征跟踪和网格路径运动的视频稳像算法。通过SIFT算法提取视频帧的特征点,采用KLT算法追踪特征点,利用RANSAC算法估计相邻帧间的仿射变换矩阵,将视频帧划分为均匀的网格,计算视频的运动轨迹,再通过极小化能量函数优化平滑多条网格路径。最后由原相机路径与平滑相机路径的关系,计算相邻帧间的补偿矩阵,利用补偿矩阵对每一帧进行几何变换,从而得到稳定的视频。实验表明,该算法在手持移动设备拍摄的抖动视频中有较好的结果,其中稳像后视频的PSNR平均值相比原抖动视频PSNR值大约提升了11.2 dB。与捆绑相机路径方法相比约提升了2.3 dB。图像间的结构相似性SSIM平均值大约提升了59%,与捆绑相机路径方法相比约提升了3.3%。 熊炜 王传胜 管来福 童磊 刘敏 刘敏关键词:视频稳像 RANSAC算法 PSNR SSIM 基于预测和残差细化网络的道路提取算法研究 被引量:4 2020年 针对航拍图像中的道路检测问题,提出了一种基于预测和残差细化网络的航拍图像道路提取算法。首先,预测网络进行初始预测,为了提高分割网络的细化能力,学习到更高层的道路特征信息,预测网络中引入了空洞卷积和多核池化模块。其次,残差细化网络对预测网络的输出进一步细化,改善预测网络结果出现的模糊问题。此外,针对航拍图像中道路像素比例较小的特点,网络还融合了二元交叉熵、结构相似性以及交并比损失函数,以减少道路信息损失。在Massachusetts道路数据集上的实验结果表明,精确率、召回率、F值和准确率等指标分别达到了99.3%,95.7%,97.3%和95.1%,交并比及平均结构相似性评价指标也分别达到了94.8%和84.3%,相比于其他算法,该算法有一定的应用价值。 熊炜 管来福 王传胜 童磊 李利荣 李利荣关键词:航拍图像 道路提取 损失函数 复杂光照下DPM图像自适应多阈值分割方法研究 被引量:9 2018年 复杂工况下,CCD相机采集到的DPM(Direct Part Mark)工业二维码图像受光照影响易出现大片光斑或阴影区域,造成DPM区域的信息遗漏,从而导致识别困难。为此,提出一种基于分段直方图凹度分析的多阈值自适应分割算法。首先在灰度直方图平滑的基础上计算出系列局部峰值,并借此完成直方图分段,再递推计算出每分段区域下凹处的分割阈值。其次通过引入基于阈值点局部区域信息的修正因子,使分割阈值自适应变化而更适用于局部对比度较低的状况。实验结果表明,该方法分割效果优于经典的阈值分割算法,平均运行效率比最快的多阈值分割算法提高17.75倍。经自适应局部阈值分割后,DPM图像复杂光照区域有用信息得以增强,缺失信息得以弥补,为后续的对象识别奠定基础。该方法也可推广于对比度多变的图像增强。 王娟 王萍 刘敏关键词:修正因子 自适应分割 基于CNN的改进行人重识别技术 被引量:2 2019年 针对行人重识别研究中训练样本的不足,为提高识别精度及泛化能力,提出一种基于卷积神经网络的改进行人重识别方法。首先对训练数据集进行扩充,使用生成对抗网络无监督学习方法生成无标签图像;然后与原数据集联合作半监督卷积神经网络训练,通过构建一个Siamese网络,结合分类模型和验证模型的特点进行训练;最后加入无标签图像类别分布方法,计算交叉熵损失来进行相似度量。实验结果表明,在Market-1501、CUHK03和DukeMTMC-reID数据集上,该方法相比原有的Siamese方法在Rank-1和mAP等性能指标上有近3~5个百分点的提升。当样本较少时,该方法具有一定应用价值。 熊炜 冯川 熊子婕 王娟 王娟 刘敏关键词:卷积神经网络 交叉熵 基于深度学习特征点法的单目视觉里程计 被引量:2 2020年 针对特征点法的视觉里程计VO中光度、视点变化对特征点提取稳定性降低的不利影响,提出一种基于深度学习特征点法的单目VO方法。采用自监督深度学习网络训练得到DSP特征点检测器。首先使用亮度非线性逐点调整方法对训练图像进行光度调整;然后使用非极大值抑制方法剔除冗余DSP特征点,改进最邻近方法得到双向最邻近方法,解决特征点匹配问题;最后建立最小化重投影误差方程求解优化位姿及空间点参数。在Hpatches、Visual Odometry数据集上进行验证,实验结果表明:DSP特征点检测器增强了特征匹配对光度、视点变化的鲁棒性;无后端优化的条件下,本方法定位均方根误差比ORB方法明显降低,且保证了系统实时性,为特征点法的VO提供新的解决思路。 熊炜 金靖熠 王娟 王娟 刘敏关键词:视觉里程计 重投影误差 融合背景估计与U-Net的文档图像二值化算法 被引量:8 2020年 针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,即U-Net对背景减除图像进行前景背景分割,最后采用全局最优阈值处理方法获得最终二值图像。实验结果表明,在2016和2017年国际文档图像二值化竞赛(DIBCO)中该算法的F值(F-measure,FM)、伪F值(pseudo F-measure,p-FM)、峰值信噪比(peak signal to noise ratio,PSNR)、距离倒数失真度量(distance reciprocal distortion,DRD)比性能次优的经典算法最高有5.58%、2.47%、0.86 dB、1.19%的性能提升。 熊炜 王鑫睿 王娟 王娟 刘敏关键词:对比度增强 网格门户构建工具比较研究 被引量:1 2013年 介绍网格门户的内涵、特征及构建工具,在调研现有网格门户构建工具的基础上,提出包括可用性、功能性、技术性三方面共计20个二级指标的评价框架,并用其对主流网格门户构建工具进行比较,指出其在关键特性方面存在的差异。 孙雨生 刘敏 仇蓉蓉关键词:网格门户 JETSPEED 动态场景中基于绝对差值和的前景检测算法 2017年 针对动态场景中前景检测误报率较高的问题,结合视频序列中背景图像存在时域高冗余的特点,提出一种改进的前景检测算法。基于滑动窗口机制组建微视频基元(MVBE),采用时空绝对差值和计算MVBE的冗余性,对冗余性较低的MVBE采用动态纹理(DT)进行建模。利用批量主成分分析方法估计DT参数,并引入观测性测量方法计算MVBE中每个像素点的显著度以实现前景检测。实验结果表明,该算法相比KDE,GMM等检测算法对场景的动态变化具有更好的抑制效果,并且取得了较鲁棒的前景检测结果。 刘敏 赵丹丹 武明虎 王娟关键词:动态纹理 一种基于动态纹理的烟雾和火焰检测方法 被引量:7 2014年 在介绍图像型火灾探测器的系统组成的基础上,根据早期火灾的热物理现象,采用视频滑动窗口机制,基于动态纹理建模,提出了一种在阴燃和火羽流阶段分别对烟雾、火焰和烟雾进行检测的算法流程。介绍运动区域检测和烟雾或火焰检测算法,并进行试验验证。仿真结果表明,显著性运动检测方法可以准确地检测到烟雾、火焰和烟雾发生的区域,并且实时性也比较高。 胡勤 陈琛 刘敏关键词:阴燃 火羽流 动态纹理