您的位置: 专家智库 > >

安徽高校省级自然科学研究基金(KJ2008A058)

作品数:1 被引量:8H指数:1
相关作者:万海峰唐昊周雷韩江洪更多>>
相关机构:合肥工业大学教育部更多>>
发文基金:教育部留学回国人员科研启动基金国家自然科学基金安徽省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇会议论文
  • 1篇期刊文章

领域

  • 3篇自动化与计算...
  • 1篇机械工程
  • 1篇理学

主题

  • 2篇Q学习
  • 1篇多AGENT...
  • 1篇性能函数
  • 1篇优化控制
  • 1篇劣化系统
  • 1篇模拟退火
  • 1篇分层强化学习
  • 1篇多AGENT...
  • 1篇OPTION

机构

  • 4篇合肥工业大学
  • 1篇教育部

作者

  • 3篇周雷
  • 1篇韩江洪
  • 1篇孔凤
  • 1篇张晓艳
  • 1篇郭一明
  • 1篇唐昊
  • 1篇万海峰

传媒

  • 1篇自动化学报

年份

  • 4篇2010
1 条 记 录,以下是 1-4
排序方式:
多Agent系统连续时间Option算法
传统用于解决多Agent系统的分层强化学习(Hierachical Reinforcement Learning,HRL),基本上是建立在离散时间多Agent半马尔科夫决策过程(Discrete Time Multi-A...
张晓艳唐吴韩江洪周雷
关键词:分层强化学习OPTION
文献传递
基于Q学习的劣化系统检测与维修问题求解
针对离散状态连续时间下的劣化系统检测与维修问题,本文建立了半马尔科夫决策过程(Semi-MarkovDecisionProcess,SMDP)模型。由于状态的转移概率难以求解,以及为了避免结果陷入局部最优值,本文使用Q学...
郭一明周雷唐昊史久根
关键词:劣化系统Q学习模拟退火
文献传递
基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制被引量:8
2010年
研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)系统的最优控制问题,其优化目标是通过合理选择每个CSPS的Look-ahead控制策略,实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想,对每个Agent的原始性能函数进行改进,引入了具有扩散功能的局域信息交互项(原始项看作具有反应功能);并运用性能势理论,构建一种适用于平均和折扣两种性能准则的Wolf-PHC多Agent学习算法,以求解决策时刻不同步的多站点的协作Look-ahead控制策略.最后,论文通过仿真实验验证了该算法的有效性,学习结果表明,通过性能函数的改进,各工作站的负载平衡性得到改善,整个系统的工件处理率也明显提高.
唐昊万海峰韩江洪周雷
关键词:多AGENT强化学习性能函数
基于在线支持向量机的CSPS优化控制
研究传送带给料生产加工站(Conveyor-Serviced Production Station,CSPS)系统的最优控制问题,其优化目标是通过合理选择站点的前视(look-ahead)控制策略,实现系统的长远期望代价...
孔凤周雷唐昊
关键词:Q学习
文献传递
共1页<1>
聚类工具0