公共文化服务平台

王瑞平: 作品数：13 被引量：37H指数：3; 供职机构：中国科学院计算技术研究所更多>>; 发文基金：国家自然科学基金中国科学院“百人计划”国家高技术研究发展计划更多>>; 相关领域：自动化与计算机技术文化科学更多>>

合作作者

视频人脸识别进展综述被引量：9: 2021年; 人脸识别是生物特征识别领域的一项关键技术,长期以来得到研究者的广泛关注。视频人脸识别任务特指从一段视频中提取出人脸的关键信息,从而完成身份识别。相较于基于图像的人脸识别任务来说,视频数据中的人脸变化模式更为多样且视频帧之间存在较大差异,如何从冗长而复杂的视频中抽取到人脸的关键特征成为当前的研究重点。以视频人脸识别技术为研究对象,首先介绍了该技术的研究价值和存在的挑战;接着对当前研究工作的发展脉络进行了系统的梳理,依据建模方式将传统基于图像集合建模的方法分为线性子空间建模、仿射子空间建模、非线性流形建模、统计建模四大类,同时对深度学习背景下基于图像融合的方法进行了介绍;另外对现有视频人脸识别数据集进行分类整理并简要介绍了常用的评价指标;最后分别采用灰度特征和深度特征在YTC数据集及IJB-A数据集上对代表性工作进行评测。实验结果表明:神经网络可以从大规模数据中提取到鲁棒的视频帧特征,从而带来识别性能的大幅提升,而有效的视频数据建模能够挖掘出人脸潜在的变化模式,从视频序列包含的大量样本中找到更具判别力的关键信息,排除噪声样本的干扰,因此基于视频的人脸识别具有广泛的通用性和实用价值。; 白子轶毛懿荣王瑞平; 关键词：视频人脸识别子空间学习流形学习

视觉模式的局部建模及非线性特征获取理论与方法研究: 陈熙霖山世光高文王瑞平张文超柴秀娟; 该成果属于模式识别和计算机图像处理领域。主要发现点包括：提出了借鉴人类视觉特性的局部模式建模方法；提出了视觉内在非线性信息的提取与度量方法；提出了逆成像过程分析的建模方法。成果共发表论文70篇，其中包括IEEETrans...; 关键词：; 关键词：模式识别计算机图像处理

大规模视觉检索前沿技术进展被引量：1: 2020年; 近年来,随着深度学习和人工智能技术的不断进步,大规模视觉检索技术也取得了长足的发展,在实际生活中的应用也越来越广泛。本文简要介绍了视觉检索技术的产生背景和基本流程,回顾了传统的实值特征检索技术,重点阐述了近年来备受关注的基于哈希学习的二值检索技术,最后介绍了大规模视觉检索技术在新零售、娱乐、安防领域的一些成功应用实践。; 王睿岿王瑞平; 关键词：人工智能技术安防领域视觉

一种多角度物体检测方法和系统: 本发明涉及一种多角度物体检测方法，包括：以深度神经网络构建检测模型；对训练图提取特征以获得多个特征图，设置多个垂直矩形锚框，获取该垂直矩形锚框与该训练图的样本物体的相交比，并以该相交比大于正例阈值的垂直矩形锚框标记为该训...; 刘永王瑞平山世光陈熙霖; 文献传递

基于支持向量机的人脸检测训练集增强被引量：22: 2008年; 根据支持向量机(support vector machine,简称SVM)理论,对基于边界的分类算法(geometric approach)而言,类别边界附近的样本通常比其他样本包含有更多的分类信息.基于这一基本思路,以人脸检测问题为例,探讨了对给定训练样本集进行边界增强的问题,并为此而提出了一种基于支持向量机和改进的非线性精简集算法IRS(improved reduced set)的训练集边界样本增强算法,用以扩大训练集并改善其样本分布.其中,所谓IRS算法是指在精简集(reduced set)算法的核函数中嵌入一种新的距离度量——图像欧式距离——来改善其迭代近似性能,IRS可以有效地生成新的、位于类别边界附近的虚拟样本以增强给定训练集.为了验证算法的有效性,采用增强的样本集训练基于AdaBoost的人脸检测器,并在MIT+CMU正面人脸测试库上进行了测试.实验结果表明,通过这种方法能够有效地提高最终分类器的人脸检测性能.; 王瑞平陈杰山世光陈熙霖高文; 关键词：人脸检测支持向量机 ADABOOST

一种多角度物体检测方法和系统: 本发明涉及一种多角度物体检测方法，包括：以深度神经网络构建检测模型；对训练图提取特征以获得多个特征图，设置多个垂直矩形锚框，获取该垂直矩形锚框与该训练图的样本物体的相交比，并以该相交比大于正例阈值的垂直矩形锚框标记为该训...; 刘永王瑞平山世光陈熙霖; 文献传递

基于深度学习和哈希编码的图像检索方法: 本发明涉及一种基于深度学习和哈希编码的模型训练方法，包括将部分标注的图像数据作为网络模型的训练数据，通过深度网络将所述训练数据表示为类二值哈希编码，其中，所述类二值哈希编码是指取值是连续值的一种模拟二值哈希编码；将获得的...; 陈熙霖刘昊淼王瑞平

附加偏见预测器辅助的均衡化场景图生成: 2022年; 场景图是以场景中的物体为结点、以物体之间的关系为边构成的图结构,在视觉与语言交互理解和推理相关任务中具有广泛的应用前景.近年来,场景图自动生成逐渐受到关注,但生成结果中对于关系的描述受到长尾分布带来的偏见的影响,偏向于样本量较大的头部关系.然而头部关系往往过于空泛,描述不够准确,容易造成误解.由于这种关系价值不高,生成的场景图近似于退化为场景中物体信息的堆叠,不利于其他应用在图结构上进行结构化推理.为了使场景图生成器在这种不均衡的数据条件下,能够更均衡地学习,给出更加多样化的特别是尾部的更准确的关系,本文提出一种附加偏见预测器(additional biased predictor,ABP)辅助的均衡化学习方法.该方法利用一条有偏见的关系预测分支,令场景图生成器抑制自身对头部关系的偏好,并更加注重尾部关系的学习.场景图生成器需要为指定的一对物体预测关系,这是一种实例级的关系预测,与之相比,有偏分支以更简洁的方式预测出图像中的关系信息,即不指定任何一对物体,直接预测出图像中存在的关系,这是一种区域级的关系预测.为此,本文利用已有的实例级的关系标注,设计算法自动构造区域级的关系标注,以此来训练该有偏分支,使其具有区域级关系预测的能力.在不同场景图生成器上应用ABP方法,并在多个公开数据集(Visual Genome,VRD和OpenImages等)上进行实验,结果表明,ABP方法具有通用性,应用ABP方法训练得到的场景图生成器能够预测出更加多样化的、更准确的关系,进而生成更有价值、更实用的场景图.; 王文彬王瑞平陈熙霖

基于深度学习和哈希编码的图像检索方法: 本发明涉及一种基于深度学习和哈希编码的模型训练方法，包括将部分标注的图像数据作为网络模型的训练数据，通过深度网络将所述训练数据表示为类二值哈希编码，其中，所述类二值哈希编码是指取值是连续值的一种模拟二值哈希编码；将获得的...; 陈熙霖刘昊淼王瑞平; 文献传递

ChatGPT背后的多模态感知: 2023年; 人们通过看、触、吃等一系列“多模态联动”,来判断“这是一个苹果”,而AI对各种模态的研究已进展多时,今天,视觉与语言的跨模态生成不仅有趣,而且有用——AI大模型似乎越来越懂人类的“常识”。; 张琴琴(整理)王瑞平; 关键词：多模态 AI

王瑞平

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

王瑞平

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈