肖云伟
- 作品数:5 被引量:3H指数:1
- 供职机构:同济大学电子与信息工程学院控制科学与工程系更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金更多>>
- 相关领域:自动化与计算机技术金属学及工艺化学工程更多>>
- 宝钢电镀锡机组监控系统软件设计与实现
- 针对宝钢电镀锡机组原有监控系统的不足,提出了一种新的电镀锡机组监控解决方案。新系统在解决原有问题的同时增加了分析功能,包括趋势图显示、张力负荷分析、阳极板使用分析和报警信息四大模块。在该系统中,监控计算机通过以太网与 P...
- 肖云伟李东江陈启军
- 关键词:ADO.NET趋势图TCP/IP
- 文献传递
- 基于行动分值的强化学习与奖赏优化的研究与实现
- 针对强化学习算法收敛速度慢,奖赏函数的设计需要改进的问题,提出基于行动分值的强化学习算法。新算法使用“行动分值”作为智能行为者选择动作的依据。行动分值比传统的状态值具有更高的灵活性,因此更容易针对行动分值设计更加优化的奖...
- 肖云伟
- 关键词:强化学习算法计算机仿真
- 文献传递
- 宝钢电镀锡机组监控系统的研究与实现
- 宝钢电镀锡机组是重要的成品机组,配置的监控系统受厂家和年代限制,存在着扫描周期长、数据存储容量小、变量无法任意组合和编辑等问题。本论文所设计的监控系统,在解决这些问题的同时增加了分析功能,包括趋势图显示、张力负荷分析、阳...
- 李东江肖云伟陈启军
- 关键词:TCP/IP
- 文献传递
- 基于行动分值的强化学习与奖赏优化被引量:2
- 2007年
- 针对强化学习算法收敛速度慢、奖赏函数的设计需要改进的问题,提出一种新的强化学习算法.新算法使用行动分值作为智能行为者选择动作的依据.行动分值比传统的状态值具有更高的灵活性,因此更容易针对行动分值设计更加优化的奖赏函数,提高学习的性能.以行动分值为基础,使用了指数函数和对数函数,动态确定奖赏值与折扣系数,加快行为者选择最优动作.从走迷宫的计算机仿真程序可以看出,新算法显著减少了行为者在收敛前尝试中执行的动作次数,提高了收敛速度.
- 陈启军肖云伟
- 宝钢电镀锡机组监控系统软件设计与实现被引量:1
- 2006年
- 针对宝钢电镀锡机组原有监控系统的不足,提出了一种新的电镀锡机组监控解决方案。新系统在解决原有问题的同时增加了分析功能,包括趋势图显示、张力负荷分析、阳极板使用分析和报警信息四大模块。在该系统中,监控计算机通过以太网与PLC连接。本软件完全基于.NetFramework1.1开发。
- 肖云伟李东江陈启军
- 关键词:ADO.NET趋势图TCP/IP