王利存
- 作品数:7 被引量:16H指数:2
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家重点基础研究发展计划上海市自然科学基金国家重点实验室开放基金更多>>
- 相关领域:理学电子电信自动化与计算机技术经济管理更多>>
- 连续时间可重入生产系统调度策略灵敏度分析被引量:2
- 2001年
- 对平均费用型连续时间马尔可夫过程 ,由其泊松方程 ,推导了系统品质指标对系统参数的梯度公式 ,并给出了相应的梯度估计算法 ;对可重入排队网络建立马尔可夫模型 ,通过仿真单个样本轨迹 ,应用给出的算法 ,研究了连续时间可重入生产系统品质指标对参数的灵敏度。
- 王利存郑应平
- 关键词:调度策略马尔可夫过程
- 基于仿真的可重入排队网络灵敏度分析被引量:6
- 2001年
- 由马尔可夫链的 Poisson方程推导了系统平均费用型品质指标对参数的导数公式 ,并给出了相应的估计算法。对可重入排队系统建立马尔可夫模型 ,通过仿真单个样本轨迹 ,应用给出的算法求出系统品质对参数的灵敏度 ,并分析了某些优先级调度策略的鲁棒性。仿真结果证明了该算法的实用性和有效性。
- 王利存郑应平
- 关键词:马尔可夫链排队网络计算机仿真
- 马氏决策过程的递阶强化学习与灵敏度分析
- 强化学习集成了人工智能与最优控制的基本思想,为求解大规模随机决策、优化和控制问题提供了一种有效方法,正逐渐引起人工智能、自动控制、运筹学、经济管理等各领域的研究兴趣.在现有马氏决策和强化学习理论已有成果的基础上,该文研究...
- 王利存
- 文献传递
- 可重入生产系统的递阶增强型学习调度被引量:2
- 2001年
- 对平均报酬型马氏决策过程 ,本文研究了一种递阶增强型学习算法 ;并将算法应用于一个两台机器组成的闭环可重入生产系统 ,计算机仿真结果表明 ,调度结果优于熟知的两种启发式调度策略 .
- 王利存郑应平
- 关键词:超大规模集成电路
- 可重入生产系统的QBD型模型被引量:2
- 2001年
- 考虑可重入生产系统除第一个外均为有限缓冲区的情形 ,建立了两种两站四缓冲区的拟生灭过程 ( QBD)型模型 .系统在随机调度策略下状态集是不可约的 ,而在最后一个缓冲区先加工 ( LBFS)的策略下状态集是可约的 .将可约的状态集化成不可约的吸收集和可约状态集的和 .求出了系统状态的稳态分布 。
- 郑应平赵丽娜王利存
- 关键词:拟生灭过程稳定性
- 开环可重入排队网络的递阶增强型学习调度被引量:2
- 2002年
- 对平均费用型马氏决策过程 ,研究了一种递阶增强型学习算法 ;并将算法应用于一个两台机器组成的开环可重入生产系统 ,计算机仿真结果表明 。
- 王利存郑应平
- 关键词:马尔可夫决策过程
- 一类事件驱动马氏决策过程的Q学习被引量:2
- 2001年
- 对广泛存在的一类事件驱动的平均费用型马尔可夫决策问题 ,通过分析其模型特征 ,研究了一种简单的增强型学习算法 ,不必将事件扩充为系统状态 ,而只对原始状态的值函数进行学习 ,减少了计算量和数据存储量。将算法应用于M/M/1排队系统的接纳控制问题 ,计算机仿真结果表明 ,算法优于通常的增强型学习和动态规划方法 。
- 王利存郑应平
- 关键词:马氏决策过程马尔可夫过程Q学习