您的位置: 专家智库 > >

李明杰

作品数:1 被引量:0H指数:0
供职机构:海南大学三亚学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇迭代
  • 1篇迭代算法
  • 1篇MARKOV...

机构

  • 1篇海南大学

作者

  • 1篇杨大全
  • 1篇杨婷婷
  • 1篇刘小飞
  • 1篇李明杰

传媒

  • 1篇微处理机

年份

  • 1篇2011
1 条 记 录,以下是 1-1
排序方式:
顺序价值迭代算法求解不确定规划
2011年
基于Markov决策过程(MDP)的规划方法可以处理多种不确定规划问题,价值迭代算法(VI)是求解MDP的经典算法,但VI需要计算更新每个状态的值,求解过程相当缓慢。在分析了MDP状态图本身的因果依赖关系的基础上,提出一种改进的价值迭代算法,称为顺序价值迭代算法(SVI)。它先将一个MDP分解成多个拓扑有序的强连通分量,然后应用价值迭代算法顺序求解各个分量,这样处理可以避免对大量无用状态的计算并使得可用状态排成拓扑序列。对比实验结果证明了该算法的有效性及优异性能。
刘小飞杨大全李明杰聂庆欣杨婷婷
关键词:MARKOV决策过程
共1页<1>
聚类工具0