国家自然科学基金(61272258)
- 作品数:13 被引量:104H指数:5
- 相关作者:马小虎刘纯平龚声蓉季怡郑刚民更多>>
- 相关机构:苏州大学常熟理工学院吉林大学更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金江苏省产学研联合创新资金项目更多>>
- 相关领域:自动化与计算机技术农业科学电子电信交通运输工程更多>>
- 基于公共向量的模糊邻域保持嵌入算法
- 2014年
- 邻域保持嵌入(NPE)算法直接使用K近邻重构样本,由于未区分同类近邻与异类近邻的重要性导致其识别效果不佳,因此提出一种基于公共向量(CV)的模糊邻域保持嵌入算法.首先根据样本K近邻的类别信息求出每个样本对每个类别的隶属度,然后使用公共向量和隶属度重构每个样本,并最小化原始样本与重构样本的残差,最后将该问题转化为求解相应的广义特征值问题以获得最终的投影变换矩阵.该算法尽可能减少投影后同类样本的差异性,较好地分离异类样本.在ORL、Yale、AR和PIEC29这4个人脸数据库上的相关实验验证了算法的有效性.
- 郑海涛郑刚民马小虎
- 关键词:人脸识别
- 基于多特征的行人再识别研究
- 行人再识别是当前计算机视觉研究的热点,也是一个开放研究课题,其在人机交互、安保、监控以及法庭取证等领域有着广泛的应用前景。所以对行人再识别的特征表示和度量学习的研究具有现实应用价值和理论意义。 为了提升行人再识别的准确...
- 宋梦也
- 关键词:计算机视觉
- 文献传递
- 基于迁移学习和批归一化的菜肴图像识别方法被引量:4
- 2021年
- 菜肴图像识别属于图像细粒度识别。针对菜肴子类之间差距小、外观差异大且受外界因素影响难以识别问题,提出一种基于迁移学习和批归一化结合的深度学习模型菜肴图像识别方法。以预训练的VGG-16为迁移学习基础,对部分卷积层以及全连接层输出做批归一化处理,最终得到尺度变换和平移后的特征集合。通过迁移学习解决深度学习所带来的过拟合问题,获取比人工特征更具有鉴别性的深度特征;通过批归一化处理缓解深度学习中存在的梯度消失问题。迁移学习的相关实验中以loss、top1、top5准确率为指标;批归一化相关实验中以top1准确率和top5准确率为指标。实验表明,在VireoFood172和UEC-Food100数据集上,所提出的模型与原始模型相比,loss明显下降,准确率有大幅提升,并且与现有方法相比在菜肴图像识别的top1和top5准确率上均有所提升。
- 郭心悦胡沁涵刘纯平杨季文
- 关键词:卷积神经网络
- 基于跨视角判别词典嵌入的行人再识别被引量:6
- 2019年
- 行人再识别是指在具有不重叠视域的摄像机监控网络中根据行人外观进行身份关联的任务.由于在视频监控系统中具有广泛的应用前景,受到了计算机视觉与机器学习领域的广泛关注.当前的行人再识别研究主要关注从行人图像中提取判别性的特征描述子或学习距离度量.然而不同摄像机视角下行人的外观常常存在很大差异,同一摄像机下还会有行人外观相近的情况,这使得特征描述子或距离度量的表达能力受到了很大的影响.为了增强它们的表达能力并提升行人再识别的准确率,提出了一种基于跨视角判别性词典嵌入的行人再识别算法.在该算法中不仅学习了跨视角的词典还同时联合学习了一个距离度量矩阵,从而将两者的优势结合起来.该算法模型有效地挖掘了不同视角下词典表达的内在联系与距离约束,从而能够使用学习到的表达能力更强的特征在嵌入子空间中进行行人再识别.为了避免不均衡训练样本带来的度量矩阵偏差问题,在度量矩阵的学习中还引入了自适应的权重分配策略.在模型优化上,采用了高效的交替优化方法来求解词典与距离度量等模型参数.在VIPeR,GRID,3DPeS等数据集上的实验结果表明本文算法取得了非常优秀的行人再识别性能.
- 陆萍董虎胜钟珊龚声蓉
- 改进BP神经网络的EMG手指运动识别被引量:6
- 2014年
- 在基于肌电信号(EMG)手指运动的模式识别中,稳定性和识别率是两个主要问题,为此提出了一种新的EMG模式识别算法。该算法采用现代信号处理理论中的AR模型和改进的BP神经网络相结合的算法,有效的解决了BP网络识别中落入局部极值问题。进行试验,将提取到的特征值输入MATLAB建立一个改进多层BP神经网络,识别三个不同类型的手指运动。实验表明,改进BP算法较传统BP算法获得了更高的识别精度,达到94%左右。
- 方一新
- 关键词:BP神经网络AR模型
- 基于多层卷积神经网络特征和双向长短时记忆单元的行为识别(英文)被引量:12
- 2017年
- 鲁棒的视频行为识别由于其复杂性成为了一项极具挑战的任务.如何有效提取鲁棒的时空特征成为解决问题的关键.在本文中,提出使用双向长短时记忆单元(Bi-LSTM)作为主要框架去捕获视频序列的双向时空特征.首先,为了增强特征表达,使用多层的卷积神经网络特征代替传统的手工特征.多层卷积特征融合了低层形状信息和高层语义信息,能够捕获丰富的空间信息.然后,将提取到的卷积特征输入Bi-LSTM,Bi-LSTM包含两个不同方向的LSTM层.前向层从前向后捕获视频演变,后向层反方向建模视频演变.最后两个方向的演变表达融合到Softmax中,得到最后的分类结果.在UCF101和HMDB51数据集上的实验结果显示本文的方法在行为识别上可以取得较好的性能.
- 葛瑞王朝晖徐鑫季怡刘纯平龚声蓉
- 关键词:卷积神经网络递归神经网络
- Multimodal Cross-guided Attention Networks for Visual Question Answering
- Visual Question Answering(VQA) is an attractive topic combining computer vision with natural language processi...
- Haibin LiuShengrong GongYi JiJianyu YangTengfei XingChunping Liu
- 关键词:ATTENTION
- 一种残差置乱上下文信息的场景图生成方法被引量:3
- 2019年
- 场景图在视觉理解中有着很重要的作用.现有的场景图生成方法对于主语、宾语以及主宾语间的视觉关系进行研究.但是,人类通过空间关系上下文、语义上下文和目标之间的互动信息来进行关系的理解和推理.为了获得更好的全局上下文表示,同时减少数据集偏差的影响,提出了一个新的场景图生成框架RSSQ(residual shuffle sequence model).该框架由目标解码、残差置乱和位置嵌入3部分构成.残差置乱模块由随机置乱和残差连接的双向LSTM的基本结构叠加而成,利用迭代方式实现随机打乱双向LSTM的隐藏状态以减少数据集偏差影响,利用残差连接提取共享的全局上下文信息.在位置嵌入模块中,通过对目标的相对位置和面积比例的编码则可以增强目标对之间的空间关系.在数据集Visual Genome的3个不同层次子任务的实验中,证明了提出的RSSQ方法因全局上下文改善和空间关系增强,在Recall@50和Recall@100指标评价下,相对于现有方法能生成更好的场景图.
- 林欣田鑫季怡徐云龙刘纯平
- 关键词:场景图上下文目标检测
- 快速路匝道汇入方案优化及软件仿真
- 2013年
- 针对城市快速路交通压力日益增长,匝道汇入处经常形成拥堵、交通事故频发等现状,结合当前城市快速路现状,通过理论计算和仿真实验方法,对现有汇入方案进行分析和优化,提出了"限速增道"汇入方案.方案在匝道汇入处采取隔离和限制措施,适当减少主、匝道车道宽度,降低车辆速度,引主导、匝道车辆各行其道,减少相互干扰,最终达到提高汇入处通行能力的目的.仿真实验数据显示,方案的单位时间车流量、通行速度、排队长度等交通指标均明显优于其它方案,效果明显."限速增道"方案在现有车道宽度较宽的城市快速路上可以采用.
- 何福男
- 关键词:公路运输快速路通行能力
- 基于特征学习的跨年龄人脸验证方法研究
- 在计算机视觉领域,人脸验证是生物特征识别的一个重要方面,也是研究热点之一,在档案管理系统、安全验证系统、信用卡验证、公安系统的罪犯身份识别、银行和海关的监控、人机交互等领域具有广阔的应用前景。本文针对目前人脸验证存在的年...
- 翟欢欢
- 关键词:身份验证图像识别人脸检测图像处理
- 文献传递