公共文化服务平台

2024年8月25日星期日

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

安徽高校省级自然科学研究基金(KJ2008A058): 作品数：1 被引量：8H指数：1; 相关作者：万海峰唐昊周雷韩江洪更多>>; 相关机构：合肥工业大学教育部更多>>; 发文基金：教育部留学回国人员科研启动基金国家自然科学基金安徽省自然科学基金更多>>; 相关领域：自动化与计算机技术更多>>

相关作品
相关人物
相关机构
相关资助
相关领域

文献类型

3篇会议论文
1篇期刊文章

领域

3篇自动化与计算...
1篇机械工程
1篇理学

主题

2篇Q学习
1篇多AGENT...
1篇性能函数
1篇优化控制
1篇劣化系统
1篇模拟退火
1篇分层强化学习
1篇多AGENT...
1篇OPTION

机构

4篇合肥工业大学
1篇教育部

作者

3篇周雷
1篇韩江洪
1篇孔凤
1篇张晓艳
1篇郭一明
1篇唐昊
1篇万海峰

传媒

1篇自动化学报

年份

4篇2010

共 1 条记录，以下是 1-4

全选清除导出

排序方式：

多Agent系统连续时间Option算法: 传统用于解决多Agent系统的分层强化学习（Hierachical Reinforcement Learning,HRL）,基本上是建立在离散时间多Agent半马尔科夫决策过程（Discrete Time Multi-A...; 张晓艳唐吴韩江洪周雷; 关键词：分层强化学习 OPTION; 文献传递

基于Q学习的劣化系统检测与维修问题求解: 针对离散状态连续时间下的劣化系统检测与维修问题,本文建立了半马尔科夫决策过程(Semi-MarkovDecisionProcess,SMDP)模型。由于状态的转移概率难以求解,以及为了避免结果陷入局部最优值,本文使用Q学...; 郭一明周雷唐昊史久根; 关键词：劣化系统 Q学习模拟退火; 文献传递

基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制被引量：8: 2010年; 研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)系统的最优控制问题,其优化目标是通过合理选择每个CSPS的Look-ahead控制策略,实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想,对每个Agent的原始性能函数进行改进,引入了具有扩散功能的局域信息交互项(原始项看作具有反应功能);并运用性能势理论,构建一种适用于平均和折扣两种性能准则的Wolf-PHC多Agent学习算法,以求解决策时刻不同步的多站点的协作Look-ahead控制策略.最后,论文通过仿真实验验证了该算法的有效性,学习结果表明,通过性能函数的改进,各工作站的负载平衡性得到改善,整个系统的工件处理率也明显提高.; 唐昊万海峰韩江洪周雷; 关键词：多AGENT强化学习性能函数

基于在线支持向量机的CSPS优化控制: 研究传送带给料生产加工站（Conveyor-Serviced Production Station,CSPS）系统的最优控制问题,其优化目标是通过合理选择站点的前视（look-ahead）控制策略,实现系统的长远期望代价...; 孔凤周雷唐昊; 关键词：Q学习; 文献传递

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张