您的位置: 专家智库 > >

国家自然科学基金(61071135)

作品数:12 被引量:31H指数:3
相关作者:王生进丁晓青李亚利林源张旭更多>>
相关机构:清华大学宾夕法尼亚大学清华信息科学与技术国家实验室更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
相关领域:自动化与计算机技术医药卫生更多>>

文献类型

  • 12篇中文期刊文章

领域

  • 11篇自动化与计算...
  • 1篇医药卫生

主题

  • 2篇真实感
  • 2篇人脸
  • 2篇实感
  • 2篇目标检测
  • 1篇点匹配
  • 1篇动态模型
  • 1篇多模图像
  • 1篇行人
  • 1篇映射
  • 1篇直方图
  • 1篇人脸检测
  • 1篇人像
  • 1篇三维人脸
  • 1篇随机采样
  • 1篇随机场
  • 1篇特征点
  • 1篇特征点匹配
  • 1篇梯度方向
  • 1篇梯度方向直方...
  • 1篇梯度特征

机构

  • 11篇清华大学
  • 1篇中国航天员科...
  • 1篇宾夕法尼亚大...
  • 1篇清华信息科学...

作者

  • 9篇王生进
  • 7篇丁晓青
  • 4篇李亚利
  • 3篇林源
  • 2篇何智翔
  • 2篇鹿文浩
  • 2篇张旭
  • 1篇陈晨
  • 1篇方驰
  • 1篇文迪
  • 1篇何飞
  • 1篇桂良琰
  • 1篇梁舒
  • 1篇王泰青

传媒

  • 3篇自动化学报
  • 3篇清华大学学报...
  • 3篇中国图象图形...
  • 1篇航天医学与医...
  • 1篇Tsingh...
  • 1篇成都理工大学...

年份

  • 1篇2023
  • 1篇2018
  • 2篇2014
  • 6篇2012
  • 2篇2011
12 条 记 录,以下是 1-10
排序方式:
Improved Bag-of-Words Model for Person Re-identification被引量:1
2018年
Person re-identification(person re-id) aims to match observations on pedestrians from different cameras.It is a challenging task in real word surveillance systems and draws extensive attention from the community.Most existing methods are based on supervised learning which requires a large number of labeled data. In this paper, we develop a robust unsupervised learning approach for person re-id. We propose an improved Bag-of-Words(i Bo W) model to describe and match pedestrians under different camera views. The proposed descriptor does not require any re-id labels, and is robust against pedestrian variations. Experiments show the proposed i Bo W descriptor outperforms other unsupervised methods. By combination with efficient metric learning algorithms, we obtained competitive accuracy compared to existing state-of-the-art methods on person re-identification benchmarks, including VIPe R, PRID450 S, and Market1501.
Lu TianShengjin Wang
关键词:PERSONBAG-OF-WORDSUNSUPERVISEDFEATURE
ReID2.0:从行人再识别走向人像态势计算
2023年
行人再识别(person re-identification,Person ReID)指利用计算机视觉技术对在一个摄像头的视频图像中出现的某个确定行人在其他时间、不同位置的摄像头中再次出现时能够辨识出来,或在图像或视频库中检索特定行人。行人再识别研究具有强烈的实际需求,在公共安全、新零售以及人机交互领域具有潜在应用,具备显著的机器学习和计算机视觉领域的理论研究价值。行人成像存在复杂的姿态、视角、光照和成像质量等变化,同时也有一定范围的遮挡等难点,因此行人再识别面临着非常大的技术挑战。近年来,学术界和产业界投入了巨大的人力和资源研究该问题,并取得了一定进展,在多个数据集上的平均准确率均值(mean average precision,mAP)有了较大提升,并部分开始实际应用。尽管如此,当前行人再识别研究主要还是侧重于服装表观的特征,缺乏对行人表观显式的多视角观测和描述,这与人类观测的机理不尽相符。本文旨在打破现有行人再识别任务的设定,形成对行人综合性观测描述。为推进行人再识别研究的进展,本文在前期行人再识别研究的基础上提出了人像态势计算的概念(ReID2.0)。人像态势计算以像态、形态、神态和意态这4态对人像的静态属性和似动状态进行多视角观测和描述。构建了一个新的基准数据集Portrait250K,包含250000幅人像和对应8个子任务的手动标记的8种标签,并提出一个新的评价指标。提出的人像态势计算从多视角表观信息对行人形成综合性的观测描述,为行人再识别2.0以及类人智能体的进一步研究提供了参考。
王生进豆朝鹏樊懿轩李亚利
关键词:计算机视觉
多方向线积分的梯度特征被引量:1
2011年
典型的梯度特征包括HOG(梯度方向直方图)、Shapelet及Edgelet等,这些特征被广泛用于目标检测、目标识别、图像检索及场景分类等领域。针对HOG特征运算复杂度高的问题,提出了一种新的多方向线积分的梯度特征(MDIG)。通过避免计算梯度方向并利用积分图,该特征简化了计算过程,提高了计算速度,因而便于在DSP等硬件上实现。实验中新特征被应用于人体头肩检测。实验结果表明当使用AdaBoost算法训练分类器时,该特征的描述能力与HOG相当,同时其计算时间仅为HOG的1/3,整体性能优于HOG。最后,针对梯度特征的适用范围对其未来应用的发展方向进行了讨论。
何飞李亚利鹿文浩王生进丁晓青
关键词:梯度特征梯度方向直方图
基于非刚性ICP的三维人脸数据配准算法被引量:9
2014年
三维人脸扫描数据的配准是三维人脸统计学习的基础和前提。为了解决离散点群数据的精确配准问题,该文提出一种融合弹性形变的非刚性最近点迭代(ICP)三维人脸数据配准算法。该算法利用稀疏的特征点逐步形变一个高分辨率的三维模板网格(模板三维人脸)以逼近三维人脸扫描数据(目标三维人脸)。此形变过程可以建模为一个关于模板人脸上每个顶点的仿射变换的优化问题。此外,该算法通过引入弹性形变在不损失配准精度的前提下加速了配准过程。在此基础上,该文提出一种融合弹性形变和三维配准的三维人脸的头部缺失数据补齐算法,使得三维人脸模型更具有真实感和完整性。实验表明,该算法比一种目前较为广泛应用的人脸头部补齐算法更具鲁棒性。
林源梁舒王生进
关键词:三维人脸非刚性配准
匹配图像与3维模型特征点的真实感3维头重建
2011年
提出并实现一种基于两张正交图像和一个标准3维头模型,并利用2D图像特征点和3D模型特征点的匹配进行3维头模型重建的算法。首先,进行面部区域和头发区域的分割,利用色彩传递对输入图像进行颜色处理。对正面图像利用改进后的ASM(主动形状模型)模型进行特征点定位。改进局部最大曲率跟踪(LMCT)方法,更为鲁棒的定位了侧面特征点。在匹配图像特征点与标准3维头上预先定义的特征点的基础上,利用径向基函数进行标准头形变,获得特定人的3维头部形状模型。采用重建好的3维头作为桥梁,自动匹配输入图像,进行无缝纹理融合。最后,将所得纹理映射到形状模型上,获得对应输入图像的特定真实感3维头模型。
林源林茜汤锋唐亮王生进
关键词:特征点匹配纹理映射
基于马尔科夫随机场模型的多视角异质多模图像的目标检测
2012年
研究复杂背景中不同视角的不同光质图像中的特定目标检测问题。利用马尔可夫随机场模型,提出了一个基于地面区域匹配和空间约束关系的目标检测方法。在可见光俯视参考图像和红外光侧视观测图像的实验数据集上的检测结果表明,区域匹配能够有效提高召回率,而空间约束能够有效降低虚警率,获得了比一般异质光图像检测中基于边缘的方法更好的检测结果。该方法降低了不同视角带来的影响,同时能够克服图像间光质不同带来的检测困难,能够有效处理复杂背景下不同光质图像的匹配及其中目标的准确检测定位。
何智翔丁晓青
关键词:目标检测马尔可夫随机场
基于部件的三维目标检测算法新进展被引量:3
2012年
三维目标检测问题是计算机视觉领域的一个基础而重要的问题,如何解决部分遮挡、类内变化、复杂背景以及视角变化的问题是这类算法的研究重点.近年来,随着部分遮挡、类内变化等问题的逐步解决,越来越多的研究者针对视角问题展开研究.本文对三维目标检测问题进行了较为详细的分析,并且主要针对近几年的热点问题—视角问题展开讨论,介绍并总结了当前该领域的主要算法.通过对比说明了各种方法的优势与不足.
鹿文浩李亚利王生进丁晓青
关键词:目标检测
基于真实感三维头重建的人脸替换被引量:3
2012年
传统的人脸替换技术需要输入的源图像中的人脸与待替换的目标图像中的人脸姿态相似,这限制了人脸替换技术的应用。该文提出一种基于特定三维头模型重建的人脸替换技术。首先,利用替换者的2张正交图像(1张正面图像和1张侧面图像)进行三维头重建。整个三维头重建过程分为人脸图像配准、特征点匹配、标准三维头形变和纹理贴图4个部分。形变部分利用了径向基函数对标准三维头进行形变以获得最终的特定三维头模型。通过建立替换者的真实感三维头模型,渲染出与任意目标图像姿态相一致的人脸图像。为了让渲染后的人脸图像与目标图像进行无缝纹理融合,还进行了色彩传递和基于多分辨率技术的边界融合。用此方法可将故事书中的任意角色替换成用户,以此提供个性化的图书。
林源桂良琰王生进丁晓青
基于最大互信息区域跟踪的人体行为检测算法被引量:5
2012年
人体行为检测问题不仅需要判断行为的类别,而且需要估计行为发生的时间和位置,有重要的现实应用意义.人体行为检测的主要难点在于参数空间维度高以及背景运动干扰.针对上述难点,本文提出了一种基于最大互信息区域跟踪的人体行为检测算法.该算法将行为区域定义为最大互信息矩形区域,采用稠密轨迹作为底层特征,利用随机森林学习轨迹特征与行为类别的互信息函数,利用轨迹的时间连续性对行为区域进行大时间跨度的预测和跟踪.实验结果表明,该算法不仅能够有效地识别不同类别的行为,而且能够适应现实场景中背景运动的干扰,从而准确地检测和跟踪行为区域.
王泰青王生进丁晓青
嵌入式驾驶员状态检测算法的实现与优化被引量:7
2012年
提出了一种可以在嵌入式平台上实时运行的驾驶员状态检测算法.状态检测采用了基于统计学习的Adaboost算法与动态建模算法.与传统的采用主动红外光的方法相比,本系统采用对人眼更为安全的被动式方法,且对光线的变化有更好的鲁棒性.算法的主要创新点是:1)提出了检测区域自适应调整的单双眼检测相结合的Adaboost人眼检测算法,提高了人眼检测的准确性与速度;2)提出基于高斯混合模型的人眼动态建模跟踪算法,自动提取驾驶员眼睛区域灰度分布的信息,实现了对不同驾驶员人眼的建模与跟踪定位.在多个公共数据集以及实车采集的视频上进行的实验表明,该算法能够准确判断驾驶员的状态,满足实时处理的要求.
张旭李亚利陈晨王生进丁晓青
关键词:嵌入式系统
共2页<12>
聚类工具0