安徽省自然科学基金(KJ2007B061)
- 作品数:2 被引量:1H指数:1
- 相关作者:朱相冰张琦汤萍萍庞士焕更多>>
- 相关机构:东南大学安徽师范大学西北大学更多>>
- 发文基金:安徽省自然科学基金安徽省教育厅重点项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于MAXQ方法的分层强化学习被引量:1
- 2009年
- 强化学习是机器学习领域的一个重要分支,但在强化学习系统中,学习的数量会随着状态变量的个数成指数级增长,从而形成"维数灾"。为此提出了一种基于MAXQ的分层强化学习方法,通过引入抽象机制将强化学习任务分解到不同层次上来分别实现,使得每层上的学习任务仅需在较小的空间中进行,从而大大减少了学习的数量和规模。并给出具体算法——MAXQ-RLA。
- 庞士焕朱相冰张琦汤萍萍
- 关键词:分层强化学习MDP
- 基于TLA的正确性验证方法
- 2009年
- 随着面向服务的体系结构的发展,有效地组合单个分布的web服务以提供更有价值的服务成为新的热点问题。然而,在这一研究领域还存在诸多问题,比如web服务用哪种方式组合,能否实现自动组合,对组合服务进行正确性验证等等。文中主要是针对组合服务的正确性验证问题,引入时序逻辑TLA。通过把组合服务的BPEL描述转换为TLA可以理解的自动机的形式,这种方法可以很好地验证组合逻辑的正确性以及快速发现死锁等问题。
- 庞士焕朱相冰张琦汤萍萍
- 关键词:WEB服务BPEL