您的位置: 专家智库 > >

国家自然科学基金(61374158)

作品数:3 被引量:20H指数:2
相关作者:唐昊周雷韩江洪戚志东苏红更多>>
相关机构:合肥工业大学南京理工大学更多>>
发文基金:国家自然科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
相关领域:电气工程电子电信自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...
  • 1篇电子电信
  • 1篇电气工程

主题

  • 1篇电池
  • 1篇站点
  • 1篇质子
  • 1篇质子交换
  • 1篇质子交换膜
  • 1篇质子交换膜燃...
  • 1篇质子交换膜燃...
  • 1篇中断率
  • 1篇前级
  • 1篇燃料电池
  • 1篇网络
  • 1篇网络生命周期
  • 1篇网络协作
  • 1篇位置信息
  • 1篇协作路由
  • 1篇路由
  • 1篇路由算法
  • 1篇马尔可夫决策...
  • 1篇控制器
  • 1篇基于位置信息

机构

  • 3篇合肥工业大学
  • 1篇南京理工大学

作者

  • 3篇周雷
  • 3篇唐昊
  • 2篇韩江洪
  • 1篇苏红
  • 1篇张晓艳
  • 1篇谭琦
  • 1篇戚志东

传媒

  • 1篇计算机学报
  • 1篇电工技术学报
  • 1篇电子测量与仪...

年份

  • 1篇2019
  • 2篇2015
  • 1篇2014
3 条 记 录,以下是 1-4
排序方式:
基于分数阶PID控制的质子交换膜燃料电池前级功率变换器被引量:10
2019年
针对质子交换膜燃料电池(PEMFC)输出为大电流、宽电压而难以实际应用的问题,首先提出一种以四开关Buck-Boost变换器为主拓扑的PEMFC预稳压模块,采用双沿开关管触发策略减小电感电流脉动,并基于高频开关网络等效原理建立准确的动态模型;然后设计一种分数阶PID控制器实现模块的稳压补偿,并采用一种随机惯性权重PSO算法整定控制器的参数。仿真与实验结果表明,与整数阶控制器相比,分数阶PID控制器具有更好的补偿效果,在系统参数或结构变化时表现出较强的鲁棒性,所提出的模块具有高效可靠的预稳压功能。
戚志东裴进胡迪
关键词:质子交换膜燃料电池分数阶PID控制器
基于位置信息的无线网络协作路由算法被引量:8
2015年
网络生命周期是评价能量受限无线网络性能的重要指标之一,如何有效延长网络生命周期是影响该类无线网络实际应用的重要问题,优化发射功率或节约能耗是比较常见的解决方法之一。针对直接和协作2种传输链路,将协作通信技术与路由机制相结合,并基于节点的位置信息,提出一种最大化网络生命周期的协作路由算法。该算法在保证一定中断率的前提下,运用非线性规划方法求解最优发射功率,进而构建由节点发射能耗、接收能耗和剩余能量组成的权值代价公式。然后,基于Dijkstra’s最短路径,依据权值代价公式建立从源节点到目的节点的协作路由。仿真实验结果表明,该算法可以降低节点的发射功率,减少节点的能量消耗,从而有效的延长网络生命周期。
周雷苏红唐昊韩江洪
关键词:协作路由网络生命周期位置信息中断率
基于连续时间半马尔可夫决策过程的Option算法被引量:2
2014年
针对大规模或复杂的随机动态规划系统,可利用其分层结构特点或引入分层控制方式,借助分层强化学习(Hierarchical Reinforcement Learning,HRL)来解决其"维数灾"和"建模难"问题.HRL归属于样本数据驱动优化方法,通过空间/时间抽象机制,可有效加速策略学习过程.其中,Option方法可将系统目标任务分解成多个子目标任务来学习和执行,层次化结构清晰,是具有代表性的HRL方法之一.传统的Option算法主要是建立在离散时间半马尔可夫决策过程(Semi-Markov Decision Processes,SMDP)和折扣性能准则基础上,无法直接用于解决连续时间无穷任务问题.因此本文在连续时间SMDP框架及其性能势理论下,结合现有的Option算法思想,运用连续时间SMDP的相关学习公式,建立一种适用于平均或折扣性能准则的连续时间统一Option分层强化学习模型,并给出相应的在线学习优化算法.最后通过机器人垃圾收集系统为仿真实例,说明了这种HRL算法在解决连续时间无穷任务优化控制问题方面的有效性,同时也说明其与连续时间模拟退火Q学习相比,具有节约存储空间、优化精度高和优化速度快的优势.
唐昊张晓艳韩江洪周雷
关键词:分层强化学习Q学习
基于工件流信息的一种多站点CSPS的协同控制方法
研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)的协同优化控制,对站点间的协作问题进行建模和优化。目标是通过合理选择每个站点的控制策略,改善各工作站的负...
盛文学唐昊周雷谭琦
关键词:多站点
文献传递
共1页<1>
聚类工具0