国家自然科学基金(61272005) 作品数:8 被引量:32 H指数:4 相关作者: 刘全 龚声蓉 钟珊 傅启明 王朝晖 更多>> 相关机构: 苏州大学 常熟理工学院 吉林大学 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 江苏省高校自然科学研究项目 更多>> 相关领域: 自动化与计算机技术 电子电信 机械工程 更多>>
基于双向KNN排序优化的行人再识别算法 被引量:4 2019年 在跨摄像头的行人再识别任务中,光照、视角以及遮挡物等成像因素导致行人外观在不同视角下呈现出巨大变化,这使得对目标行人的再识别工作变得十分困难。利用重排序算法虽然可以在一定程度上提高行人再识别的准确率,但增加了时间成本和人力成本,且容易引入新的噪声。为此,文中提出了一种基于双向KNN排序优化的行人再识别算法。首先,采用预训练加微调的策略来提取行人的深度特征;然后,利用XQDA和KISSME两种度量学习方法来比较特征间的距离,计算初始排名;最后,根据查询图像和候选图像间的双向KNN关系计算Jaccard距离,并将其与初始距离加权求和作为重排序的参照,计算出新的排名。在CUHK03,Market1501和PRW 3个数据集上的实验表明,文中提出的重排序算法在Rank1和mAP两个评价指标上分别获得了12.2%和13.4%的提升。实验数据充分说明,基于双向KNN排序优化的行人再识别算法可以有效降低重排序时引入噪声的概率,从而提高行人再识别的准确率。 包宗铭 龚声蓉 钟珊 燕然 戴兴华关键词:距离函数 一种基于NAND闪存高效的页面替换算法 被引量:2 2017年 针对不同NAND闪存读写操作成本比例的不同,提出一种具有高效页面替换功能的EPRA算法。在内存中,每个受害者候选页被分成固定数量的闪存页面。EPRA给每个受害者候选页分配权重值,在选择与修改页面时对权重进行调节,从候选页中选择具有最小权重值的页面作为受害者页。EPRA算法把受害者页中分为热的闪存页和冷的闪存页,并把这些数据写到NAND闪存中不同空闲的块中。仿真实验结果表明,EPRA算法使用在不同种类的NAND闪存中时,性能优于现有的页面替换算法。 于万钧 张海军 刘全一种近似模型表示的启发式Dyna优化算法 被引量:4 2015年 针对基于查询表的Dyna优化算法在大规模状态空间中收敛速度慢、环境模型难以表征以及对变化环境的学习滞后性等问题,提出一种新的基于近似模型表示的启发式Dyna优化算法(a heuristic Dyna optimization algorithm using approximate model representation,HDyna-AMR),其利用线性函数近似逼近Q值函数,采用梯度下降方法求解最优值函数.HDyna-AMR算法可以分为学习阶段和规划阶段.在学习阶段,利用agent与环境的交互样本近似表示环境模型并记录特征出现频率;在规划阶段,基于近似环境模型进行值函数的规划学习,并根据模型逼近过程中记录的特征出现频率设定额外奖赏.从理论的角度证明了HDyna-AMR的收敛性.将算法用于扩展的Boyan chain问题和Mountain car问题.实验结果表明,HDyna-AMR在离散状态空间和连续状态空间问题中能学习到最优策略,同时与Dyna-LAPS(Dyna-style planning with linear approximation and prioritized sweeping)和Sarsa(λ)相比,HDyna-AMR具有收敛速度快以及对变化环境的近似模型修正及时的优点. 钟珊 刘全 傅启明 章宗长 朱斐 龚声蓉关键词:函数逼近 基于栈式降噪自动编码器的气体识别 被引量:5 2017年 为克服手工设计特征的繁杂过程以及特征不通用性,提高气体识别准确率,提出一种基于深度学习的气体定性识别方法,自动提取自适应的气体数据特征。实验基于UCI机器学习气体数据集,分别对比基于2层深度神经网络结构-栈式降噪自动编码器以及浅层机器学习算法的气体定性识别效果。实验结果表明,基于深度学习算法自动提取特征的过程更简单、通用,提高了气体识别的准确率,改善了传统方法的复杂流程。 于万钧 安改换 鹿文静 甘超 刘全关键词:气体识别 高维 A parallel scheduling algorithm for reinforcement learning in large state space 2012年 在加强学习的区域的主要挑战正在可伸缩直到更大、更复杂的问题。瞄准加强学习的可伸缩的问题,学习方法的可伸缩的加强, DCS-SRL,根据 divide-and-conquer 策略,和它的集中被建议被证明。在这个方法,在大州的空间或连续州的空间的学习问题被分解成多重更小的 subproblems。给一个特定的学习算法,每 subproblem 能与有限可得到的资源独立地被解决。最后,部件答案能被重新结合获得需要的结果。探讨在调度程序优先考虑 subproblems 的问题,安排算法的加权的优先级被建议。这个安排算法保证那计算集中于被期望最大地高效的问题空间的区域。帮助学习过程,一个新平行方法,叫的 DCS-SPRL,从把 DCS-SRL 与平行安排体系结构相结合被导出。在 DCS-SPRL 方法, subproblems 将在有能力在平行工作的处理器之中被散布。试验性的结果证明基于 DCS-SPRL 学习有快集中速度和好可伸缩性。 Quan LIU Xudong YANG Ling JING Jin LI Jiao LI关键词:调度算法 可扩展性 基于多层卷积神经网络特征和双向长短时记忆单元的行为识别(英文) 被引量:12 2017年 鲁棒的视频行为识别由于其复杂性成为了一项极具挑战的任务.如何有效提取鲁棒的时空特征成为解决问题的关键.在本文中,提出使用双向长短时记忆单元(Bi-LSTM)作为主要框架去捕获视频序列的双向时空特征.首先,为了增强特征表达,使用多层的卷积神经网络特征代替传统的手工特征.多层卷积特征融合了低层形状信息和高层语义信息,能够捕获丰富的空间信息.然后,将提取到的卷积特征输入Bi-LSTM,Bi-LSTM包含两个不同方向的LSTM层.前向层从前向后捕获视频演变,后向层反方向建模视频演变.最后两个方向的演变表达融合到Softmax中,得到最后的分类结果.在UCF101和HMDB51数据集上的实验结果显示本文的方法在行为识别上可以取得较好的性能. 葛瑞 王朝晖 徐鑫 季怡 刘纯平 龚声蓉关键词:卷积神经网络 递归神经网络 Multimodal Cross-guided Attention Networks for Visual Question Answering Visual Question Answering(VQA) is an attractive topic combining computer vision with natural language processi... Haibin Liu Shengrong Gong Yi Ji Jianyu Yang Tengfei Xing Chunping Liu关键词:ATTENTION 一种基于智能调度的可扩展并行强化学习方法 被引量:3 2013年 针对强化学习在大状态空间或连续状态空间中存在的"维数灾"问题,提出一种基于智能调度的可扩展并行强化学习方法——IS-SRL,并从理论上进行分析,证明其收敛性.该方法采用分而治之策略对大状态空间进行分块,使得每个分块能够调入内存独立学习.在每个分块学习了一个周期之后交换到外存上,调入下一个分块继续学习.分块之间在换入换出的过程中交换信息,以使整个学习任务收敛到最优解.同时针对各分块之间的学习顺序会显著影响学习效率的问题,提出了一种新颖的智能调度算法,该算法利用强化学习值函数更新顺序的分布特点,基于多种调度策略加权优先级的思想,把学习集中在能产生最大效益的子问题空间,保障了IS-SRL方法的学习效率.在上述调度算法中融入并行调度框架,利用多Agent同时学习,得到了IS-SRL方法的并行版本——IS-SPRL方法.实验结果表明,IS-SPRL方法具有较快的收敛速度和较好的扩展性能. 刘全 傅启明 杨旭东 荆玲 李瑾 李娇关键词:并行计算 可扩展性 智能调度 基于变步长迭代算法的微轴承参量特性研究 被引量:2 2017年 利用变步长迭代算法在Matlab平台上对微轴承的修正模型进行仿真模拟。通过传统连续模型、一阶滑移修正及Wu新滑移修正模型的对比发现,在最小气膜间隙处各滑移修正模型得到的参量远低于连续模型的结果。而且当气膜间隙小于1μm时,各模型之间的结果偏差随气膜间隙的减小而迅速放大,连续模型已不适于此条件下的特性分析,必须考虑滑移修正效应的影响,以便得到较精确的相关电子设备中的参量特性。 李家贤 张海军 刘全关键词:MATLAB