您的位置: 专家智库 > >

余超

作品数:18 被引量:2H指数:1
供职机构:中山大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学医药卫生电气工程更多>>

文献类型

  • 14篇专利
  • 2篇期刊文章
  • 2篇学位论文

领域

  • 6篇自动化与计算...
  • 2篇文化科学
  • 1篇电气工程
  • 1篇医药卫生

主题

  • 6篇机器人
  • 6篇机器人控制
  • 4篇控制方法
  • 4篇控制机
  • 4篇控制机器人
  • 3篇智能体
  • 2篇灯控
  • 2篇信息输入
  • 2篇训练机器人
  • 2篇元组
  • 2篇脓毒
  • 2篇脓毒症
  • 2篇网络
  • 2篇网络参数
  • 2篇网络预测
  • 2篇路网
  • 2篇交通灯
  • 2篇交通灯控制
  • 2篇交通仿真
  • 2篇公平

机构

  • 18篇中山大学
  • 2篇大连理工大学
  • 2篇南开大学
  • 2篇国防科技大学
  • 1篇香港大学

作者

  • 18篇余超
  • 4篇孙亮
  • 2篇骆伟祺
  • 1篇徐昕
  • 1篇卓汉逵
  • 1篇周颖
  • 1篇王杰
  • 1篇刘恒

传媒

  • 2篇软件学报

年份

  • 2篇2024
  • 2篇2023
  • 6篇2022
  • 4篇2021
  • 2篇2020
  • 1篇2009
  • 1篇2007
18 条 记 录,以下是 1-10
排序方式:
一种脓毒症治疗策略的学习方法及装置
本发明公开了一种脓毒症治疗策略的学习方法及装置,该方法包括:基于样本数据建立关于脓毒症治疗策略的马尔科夫决策模型;样本数据为脓毒症患者在预设时间内的病理数据;根据马尔科夫决策模型,建立脓毒症的死亡率预测模型,并获取脓毒症...
余超黄荣恒
文献传递
一种基于部件分解的机器人控制方法及装置
本发明公开了一种基于部件分解的机器人控制方法及装置,该方法首先获取待控制机器人的整体状态信息,并将整体状态信息输入至动作预测模型中,动作预测模型的动作预测网络预测根据整体状态信息,预测待控制机器人的整体动作信息;最后根据...
余超董银昭葛宏伟陈炳才孙亮
文献传递
基于强化学习的非完全信息博弈方法、系统以及电子设备
本发明提供一种基于强化学习的非完全信息博弈方法、系统以及电子设备,获取博弈场景及所述博弈场景所对应的至少两个智能体,并用多维向量表示所述智能体的各个博弈状态和博弈行为;获取博弈过程中各智能体的博弈数据;根据所述博弈数据,...
余超谭晋
文献传递
一种基于部件交互程度的机器人控制方法及装置
本发明公开了一种基于部件交互程度的机器人控制方法,方法包括:获取待控制机器人的整体状态信息;将待控制机器人的整体状态信息输入至动作预测模型中,动作预测模型对整体状态信息进行结构分解,获得各个部件的状态信息,继而根据各个部...
余超董银昭葛宏伟陈炳才孙亮
文献传递
结构交互驱动的机器人深度强化学习控制方法被引量:1
2023年
针对深度强化学习在高维机器人行为控制中训练效率低下和策略不可解释等问题,提出一种基于结构交互驱动的机器人深度强化学习方法(structure-motivated interactive deep reinforcement learning, SMILE).首先,利用结构分解方法将高维的单机器人控制问题转化为低维的多关节控制器协同学习问题,从而缓解连续运动控制的维度灾难难题;其次,通过两种协同图模型(ATTENTION和PODT)动态推理控制器之间的关联关系,实现机器人内部关节的信息交互和协同学习;最后,为了平衡ATTENTION和PODT协同图模型的计算复杂度和信息冗余度,进一步提出两种协同图模型更新方法 APDODT和PATTENTION,实现控制器之间长期关联关系和短期关联关系的动态自适应调整.实验结果表明,基于结构驱动的机器人强化学习方法能显著提升机器人控制策略学习效率.此外,基于协同图模型的关系推理及协同机制,可为最终学习策略提供更为直观和有效的解释.
余超董银昭郭宪冯旸赫卓汉逵张强
关键词:机器人控制可解释性
面向机器人系统的虚实迁移强化学习综述
2024年
近年来,基于环境交互的强化学习方法在机器人相关应用领域取得巨大成功,为机器人行为控制策略优化提供一个现实可行的解决方案.但在真实世界中收集交互样本存在高成本以及低效率等问题,因此仿真环境被广泛应用于机器人强化学习训练过程中.通过在虚拟仿真环境中以较低成本获取大量训练样本进行策略训练,并将学习策略迁移至真实环境,能有效缓解真实机器人训练中存在的安全性、可靠性以及实时性等问题.然而,由于仿真环境与真实环境存在差异,仿真环境中训练得到的策略直接迁移到真实机器人往往难以获得理想的性能表现.针对这一问题,虚实迁移强化学习方法被提出用以缩小环境差异,进而实现有效的策略迁移.按照迁移强化学习过程中信息的流动方向和智能化方法作用的不同对象,提出一个虚实迁移强化学习系统的流程框架,并基于此框架将现有相关工作分为3大类:基于真实环境的模型优化方法、基于仿真环境的知识迁移方法、基于虚实环境的策略迭代提升方法,并对每一分类中的代表技术与关联工作进行阐述.最后,讨论虚实迁移强化学习研究领域面临的机遇和挑战.
林谦余超伍夏威董银昭徐昕张强郭宪
关键词:机器人控制
肺门迷走神经高选择切断治疗哮喘应用解剖的可行性研究
目的: 1.了解国人肺门迷走神经的分支、分布走行特点、分型、毗邻关系及变异;2.查阅国内外相关文献,对比迷走神经肺支在解剖上的异同,完善国人迷走神经肺门支的解剖学理论;3.探讨双侧肺门高选择性迷走神经离断术治疗...
余超
关键词:哮喘迷走神经切断术应用解剖学
文献传递
一种同时考虑行程时间和公平性的交通灯控制方法及系统
本发明提供一种同时考虑行程时间和公平性的交通灯控制方法及系统,其中方法包括:将行程时间策略Q网络的结果值输入至行程时间策略Q网络的交通仿真环境,将公平性策略Q网络的结果值输入至公平性策略Q网络的交通仿真环境,得到每个路口...
余超梁泽年
文献传递
基于BPM的电力信息系统的设计和实现
随着全球经济一体化,企业的竞争日益国际化、白日化。企业的生存和发展面临着国内国外的竞争对手的挑战。面临挑战,企业在求生存求发展的过程中,不断地调整企业的发展战略,应用新的生产科学技术,采用新的管理理念。为了更好地协调企业...
余超
关键词:业务流程管理工作流信息集成
文献传递
基于径向差引导的圆形纹理目标定位方法
本发明公开了一种基于径向差引导的圆形纹理目标定位方法,包括:将模板匹配得到的圆形纹理目标图像作为初定位区域,计算其中心位置坐标;将修正区域分为四个象限区域,将初定位区域边缘灰度变化最平缓的象限区域作为搜索区域;在搜索区域...
张小虎袁桂鑫王杰柏昊宇赵朕瑶余超
共2页<12>
聚类工具0