杨鸿波
- 作品数:30 被引量:92H指数:5
- 供职机构:北京信息科技大学自动化学院更多>>
- 发文基金:北京市属高等学校高层次人才引进与培养计划国家自然科学基金北京市属高等学校人才强教计划资助项目更多>>
- 相关领域:自动化与计算机技术文化科学电子电信航空宇航科学技术更多>>
- 基于深度学习的人脸图像扭正算法被引量:1
- 2017年
- 人脸识别作为目前最方便的生物特征识别技术,被应用到了很多重要的领域。但是,由于光照以及姿态等因素的影响,使得人脸识别的精度降低,造成人脸识别技术在实际应用中的局限性。针对姿态以及光照因素对人脸的影响,提出一种基于深度学习的人脸扭正算法。该算法将对齐后的人脸图像首先用深度卷积网络自动地提取人脸特征,然后根据提取到的特征得到非正面人脸与正面人脸的映射关系,最后将非正面姿态的人脸扭成正面姿态且处于中性光照下的人脸图像,算法引入了欧式距离与余弦距离两个损失函数来对网络进行优化,进一提高了网络的精度。实验结果表明,该算方法可以有效地实现正面人脸的重构,减少姿态与光照对人脸特征的影响,使人脸识别精度提得到提高。
- 范雪杨鸿波李永
- 关键词:人脸识别
- 基于物理模型的深度学习水下图像恢复方法
- 2024年
- 针对复杂水下环境中图像颜色失真、细节模糊和对比度降质等问题,提出了一种基于物理模型的深度学习水下图像恢复方法,使用水下光学成像的物理模型约束生成对抗网络(generative adversarial network, GAN),为深度学习方法增加理论支撑,同时降低深度学习恢复效果对训练数据集的依赖。首先,估计物理模型的关键参数,基于视觉显著性原理简化传统透射图计算方法,并利用GAN的生成器获取的雾度图计算环境光;其次,通过物理模型计算水下恢复图像,利用GAN的鉴别器区分恢复图像和参考图像;通过不断学习优化网络参数,最终实现水下图像恢复。测试集上的实验结果表明,图像恢复效果在主客观多种评价指标上均得到有效提升。
- 李苇杭杨鸿波张洋
- 声谱图在汉语普通话声调识别中的应用被引量:3
- 2017年
- 针对汉语普通话声调的识别,采用声谱图表示声音频率信息的方法代替传统比较单一的特征提取,同时基于巨量数据和深度学习的方式,获得了可观的识别率。声调的频率特性以及不同频率之间的空间结构在声谱图中均可以得到很好的表示,同时利用深度学习中卷积神经网络模型,对声谱图进行训练学习,获取与声调相联系的大量频率特征,进而使得声调识别率得到提高,其中在验证样本集合数量为96511时,识别率为98.5%。
- 李永范雪杨鸿波
- 关键词:声谱图声调识别端点检测
- 一种基于边缘检测的液滴检测与体积计量方法被引量:1
- 2013年
- 针对输液泵故障、输液速度失控的情况,设计了一种基于背景差分法和Laplace边缘检测算子的液滴检测与体积计量方法。该方法利用运动目标检测和边缘检测方法,消除了外部噪声造成的影响,分析了液滴参数并建立了液滴像素点数量与液体体积之间的数学模型,最后通过实验验证数学模型的精确度。实验结果表明:所设计的方法可以精确地检测出液滴,并具有很好的体积计量精度,从而可以精确计算出输液量。
- 马慧高晶敏杨鸿波
- 关键词:背景差分法边缘检测
- 一种基于贝叶斯估计的图像局部匹配方法
- 2010年
- 目前报道的图像局部匹配方法一般假设参数变化符合线性或高斯分布,求解容易陷入局部极值,不能适应变形程度较大的情况。本文针对此问题提出了一种基于贝叶斯估计的方法,通过马尔科夫链蒙特卡罗(MCMC)算法求解后验概率分布的极值获得最优匹配参数。试验表明本文方法可以精确地匹配存在较大形变的点局部区域,并且可以成功地处理视频跟踪目标的尺度和方向变化。
- 杨鸿波侯霞
- 关键词:贝叶斯估计
- 基于Siamese网络的句子相似度计算方法被引量:2
- 2020年
- 句子相似度度量是自然语言处理领域的一个重要组成部分。针对传统基于统计学习的方法只能进行表面文本相似度计算,存在着无法提取出文本深层语义信息的问题,提出了一种基于Siamese网络的句子相似度计算方法,利用CNN与BiLSTM相结合的方法来挖掘句子中的深层语义信息,得到句子不同词粒度的向量表示;利用门控机制(transform gate)的思想,对BiLSTM和CNN提取的句子深层语义特征赋予不同的权重,突出对句子贡献度较大的特征,将特征组合成句子的向量表示;最后通过计算出的曼哈顿距离来度量两个句子的相似度。实验结果表明,基于CCKS2018评测项目微众银行客户问句匹配大赛数据集,该算法相比较于其他多种方法准确率和F1值都有不同程度的提高。
- 江燕侯霞杨鸿波
- 关键词:句子相似度CNN
- 移动机器人声源定位与跟踪摄录系统开发
- 2023年
- 为满足短视频博主、网络主播等对低成本、简单可靠的跟随摄录设备的需求,提出了一种基于机器听觉的跟踪拍摄机器人设计方案,并进行实验验证。该设计使用GCC-PHAT算法估计目标声源到达各麦克风之间的时延,以时延大小作为声源定位系统的输入,根据空间几何关系解算出目标声源的方位信息,并使用PID控制算法控制底盘向目标靠近。测试结果表明,该设计方案具有一定抗干扰能力,能够在室内外环境下完成对在8 m范围内目标声源的定位,实际角度分辨率约为8.5°。基于机器听觉的跟踪拍摄机器人能够实现自动识别目标、运动跟随拍摄、室内外皆可稳定运行,且硬件成本相对较低,具有一定实用价值。
- 王一群李兴旭杨鸿波刘琼陈雯柏
- 关键词:声源定位跟随控制时延估计
- 一种基于卡尔曼滤波的姿态信息融合方法被引量:4
- 2015年
- 针对卫星平台上存在的由高频微角颤振引起的载荷光轴指向精度降低,提出了一种基于卡尔曼滤波的姿态信息融合方法,提高姿态确定指向精度。建立基于星敏感器与陀螺的低频带姿态确定系统和MHD-ARS(magneto-hydro-dynamics,MHD,angular-rate-sensor,ARS)高频姿态信息测量系统的数学模型,采用卡尔曼滤波进行宽带宽的姿态信息融合。仿真结果分析表明当存在高频微角颤振时,采用卡尔曼滤波的姿态信息融合方法的估计精度要优于传统的低频带姿态确定系统,且在频域上能够实现扩展姿态测量带宽的目的,验证了姿态信息融合方法的有效性和精确性。
- 金钊高晶敏杨鸿波张科备
- 关键词:卡尔曼滤波
- 面向水声信道传输的视频编码研究进展
- 2022年
- 随着水下场景观测需求日益增长,面向水声信道传输的视频编码技术研究逐渐兴起。该技术旨在克服水声信道带宽窄、延时高和传输易错三大缺陷,可为自主式水下航行器等海洋装备的光学成像系统提供有力的技术支持,在深海探测与作业领域具有重要的应用价值。归纳了国内外在面向水声信道传输的视频编码技术方面的研究进展,并分析了水下视频编码研究现存的问题以及今后的发展方向。
- 张洋任郭晶冯清娟杨鸿波
- 关键词:视频编码水声信道多视点视频容错编码
- 双视角自然图像视差计算和深度估计
- 2013年
- 在图像前景抠图的基础上,提出一种对双视角图像视差计算以及对图像中目标物体景深估计方法。首先,对左右视图标记,提取标记图像中目标物体;然后利用前景抠图技术和二值化计算得到一幅二值化图像;最后计算左右二值化图像中对应目标物体的视差值,通过视差值判断目标物体在场景中的景深。实验结果表明,该方法计算简单,不需要图像采集设备外部参数,可以达到较高精度。
- 王啸飞张奇志杨鸿波
- 关键词:视差估计