您的位置: 专家智库 > >

裴荣

作品数:2 被引量:1H指数:1
供职机构:合肥工业大学计算机与信息学院更多>>
发文基金:教育部“新世纪优秀人才支持计划”国家教育部博士点基金国际科技合作与交流专项项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 1篇信息交互
  • 1篇协同控制
  • 1篇局域
  • 1篇QL算法
  • 1篇Q学习

机构

  • 2篇合肥工业大学

作者

  • 2篇裴荣
  • 1篇周雷
  • 1篇谭琦
  • 1篇唐昊

传媒

  • 1篇自动化学报

年份

  • 1篇2014
  • 1篇2013
2 条 记 录,以下是 1-2
排序方式:
基于状态聚类和需求驱动的多站点CSPS系统的协同控制
在多站点CSPS系统的协同控制问题中,系统的状态空间由多个站点的状态空间组成,其中每个站点的状态空间大小取决于其缓存库的容量大小,故系统状态空间的大小会随着站点个数的增加和缓存库容量的增加而成指数形式(或几何级数)增长,...
裴荣
关键词:协同控制
文献传递
基于状态聚类的多站点CSPS系统的协同控制方法被引量:1
2014年
单站点传送带给料加工站(Conveyor-serviced production station,CSPS)系统中,可运用强化学习对状态–行动空间进行有效探索,以搜索近似最优的前视距离控制策略.但是多站点CSPS系统的协同控制问题中,系统状态空间的大小会随着站点个数的增加和缓存库容量的增加而成指数形式(或几何级数)增长,从而导致维数灾,影响学习算法的收敛速度和优化效果.为此,本文在站点局域信息交互机制的基础上引入状态聚类的方法,以减小每个站点学习空间的大小和复杂性.首先,将多个站点看作相对独立的学习主体,且各自仅考虑邻近下游站点的缓存库的状态并纳入其性能值学习过程;其次,将原状态空间划分成多个不相交的子集,每个子集用一个抽象状态表示,然后,建立基于状态聚类的多站点反馈式Q学习算法.通过该方法,可在抽象状态空间上对各站点的前视距离策略进行优化学习,以寻求整个系统的生产率最大.仿真实验结果说明,与一般的多站点反馈式Q学习方法相比,基于状态聚类的多站点反馈式Q学习方法不仅具有收敛速度快的优点,而且还在一定程度上提高了系统生产率.
唐昊裴荣周雷谭琦
共1页<1>
聚类工具0