项学智
- 作品数:31 被引量:164H指数:7
- 供职机构:哈尔滨工程大学信息与通信工程学院更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信机械工程更多>>
- 色彩梯度恒常性的光流场估计算法被引量:3
- 2008年
- 为提高光流估计的鲁棒性,在彩色图像光流场计算中色彩恒常假定的基础上,进一步假定色彩梯度在运动中保持不变,据此提出了一种基于色彩梯度恒常性假设的光流求解方法,以色彩梯度构成光流基本方程,并对其施加全局平滑约束,以Gauss-Seidel迭代求解光流场,并用中值滤波去除光流场中的异常分量.实验表明,该方法相对于灰度图像序列及彩色图像序列的经典光流场估计算法可取得更好的估计效果.
- 项学智赵春晖
- 关键词:光流计算机视觉
- 一种变分偏微分多模型光流求解方法被引量:8
- 2014年
- 为提高光流计算精度,在变分偏微分计算框架下,提出了一种融合多数据项模型与平滑项模型的光流计算方法,综合利用多通道彩色信息及梯度信息构建多模型数据项,利用全局平滑约束模型构建平滑项,并对数据项与平滑项分别施加鲁棒惩罚函数以去除集外点造成的影响。为解决大位移问题,在基于中值滤波的改进金字塔模型下完成多分辨率计算。基于合成与真实图像序列的数值实验表明该算法具有较好的计算精度和较高的计算效率,是一种综合性能较优的光流估计方法。
- 项学智开湘龙张磊乔玉龙彭宇
- 关键词:光流变分法
- 改进的Katz算法及其在基于Lattice识别系统中的应用
- 2011年
- 针对传统的Katz方法会出现折扣系数大于1或者无法计算的情况,将SimpleGood-Turing中对出现次数对数域的平滑思想用于Katz方法中,结合回退模型,提出一种改进的Katz算法.将该方法应用于基于Lattice的语音识别系统中,分析不同语言学模型对生成的Lattice结构的影响和基于该结构的识别性能的影响.实验表明,应用改进的Katz算法针对访谈节目的识别性能最高可以达到60.90%,优于传统Katz方法.
- 张磊陆冬项学智
- 关键词:网格语音识别
- 基于计算听觉场景分析的混合语音分离被引量:3
- 2010年
- 基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分析,得出onset/offset线索可以同时处理清音和浊音,对声音混合类型没有限制,能得到较好的分离效果。
- 张磊刘继芳项学智
- 关键词:计算听觉场景分析片段
- 形状匹配的铁路油罐车罐口视觉定位方法
- 2024年
- 为了克服非均匀光照、车型以及摄像机安装位置等因素造成的罐口定位误差,提出了一种基于形状匹配的铁路油罐车罐口视觉定位方法。利用罐口为标准几何形状的特点,使用标准图像提取罐口边缘并进行形状拟合;将得到的轮廓形状作为图像识别模板,在待搜索图像中使用基于轮廓的归一化互相关查找目标;在搜索过程中对形状模板进行缩放,以兼容不同型号车型罐口;利用图像金字塔技术减小计算量,加快匹配速度。结果表明,所提出的方法满足误差要求,能够应用于工业现场。
- 项学智马竹山周宪坤王路乔玉龙
- 关键词:机器视觉视觉定位
- 一种彩色光流场估计算法被引量:3
- 2008年
- 彩色图像序列中通过求解光流梯度约束方程组进行光流估计可有效地克服孔径问题,但方程组在各等式线性相关或图像的梯度量级相对于噪声很小的像素点处得到不可靠解.为获得鲁棒估计结果,将规范化rgb颜色模型估计方法与全局平滑约束方法相结合,利用矩阵条件数判断规范化rgb方法光流解的可靠性,设定条件数阈值进行方法间切换,融合2种方法的估计结果.最后,对光流估计结果进行10次中值滤波.实验表明,该方法在获得稠密光流场的同时可有效提高光流场估计精度.
- 项学智赵春晖李康
- 关键词:光流彩色图像条件数
- SDH网的定时结构设计被引量:2
- 2005年
- 传输网络定时是SDH网同步设计中的一个重要层面.首先介绍了定时保护倒换规则,然后分析了在设计过程中可能遇到的由于时钟倒换快慢引起的假定时环路问题,提出了科学规划的解决方法,最后得出了简单易行的传输网络定时环状结构.该结构解决了假定时环路问题,可应用于工程实际.
- 张然项学智
- 关键词:数字通信传输网SDH时钟同步
- 多特征融合的端到端链式行人多目标跟踪网络被引量:3
- 2022年
- 目标检测、特征提取与数据关联作为多目标跟踪网络中重要的组件,独立或部分联合地发挥作用,这种组件分离的方法虽取得了良好的跟踪效果,但增加了跟踪网络的复杂性,影响了跟踪速度。为提升行人多目标跟踪速度及维持跟踪精度,提出一种端到端链式行人多目标跟踪网络。将目标检测、特征提取与数据关联集成到一个统一的框架中,将连续2帧图片组成一个节点作为输入,直接回归出节点之间相同目标的成对边界框,利用相邻节点之间公共帧的强相似性,仅使用交并比匹配进行数据关联,以提高跟踪速度。使用多特征融合的双向特征金字塔,并在金字塔网络中引用改进可变形卷积,提高模型对目标形变的适应性。为解决正负样本不平衡及梯度贡献的差异,将focal loss与BalancedL1 Loss组成多任务学习损失函数以促进网络的均衡学习。在MOT17数据集上的实验结果表明,与DeepSORT、TubeTK、CenterTrack等网络相比,该网络可有效实现跟踪速度与精度的平衡,多目标跟踪精度为69.6,跟踪速度保持为21.6 frame/s。
- 周海赟项学智王馨遥任文凯
- 关键词:多目标跟踪多特征融合
- 基于时空域融合的红外弱小目标检测新方法被引量:1
- 2008年
- 针对复杂背景下红外弱小目标的检测问题,提出一种基于时空域融合的检测方法。在空域上,通过灰度形态学Tophat变换抑制背景、增强目标;在时域上,对红外图像序列连续四帧进行沿时间轴一维小波变换,实现目标和背景的分离。然后对时空域融合的目标增强图像进行自适应阈值分割来提取弱小目标。实验结果表明,该方法能有效地检测运动红外弱小目标。
- 汲清波张兴周项学智
- 关键词:弱小目标小波变换
- 结合注意力机制的深度学习光流网络被引量:2
- 2020年
- 为提升基于编解码架构的U型网络在深度学习光流估计中的精度,提出了一种结合注意力机制的改进有监督深度学习光流网络。网络由收缩和扩张两部分组成,收缩部分利用一系列卷积层来提取图像之间的高级特征,扩张部分通过反卷积操作将特征图恢复至原始图像分辨率,将通道注意力机制引入U型网络架构中以学习通道之间的相互依赖性,自适应地调整各通道的特征权重,增强网络的特征提取能力。同时,改进的网络还使用了空洞卷积以在卷积核尺寸不变的情况下增大感受野,使用变分光流方法中的恒常约束与平滑约束以进一步利用运动先验知识提升估计效果。最后基于合成图像序列数据集进行了实验验证,实验结果表明所设计的网络能够有效提升深度学习光流估计的准确率。
- 周海赟项学智翟明亮张荣芳王帅
- 关键词:光流估计