荆玲
- 作品数:5 被引量:10H指数:2
- 供职机构:南京大学计算机科学与技术系更多>>
- 发文基金:国家高技术研究发展计划江苏省高校自然科学研究项目江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于多Agent并行采样和学习经验复用的E^3算法被引量:2
- 2013年
- 针对E3算法所需的收敛时间界限太大,在实际问题中难以有效应用的问题,提出了一种基于多Agent并行采样和学习经验复用的改进算法。该算法在探索阶段,通过多Agent并行采样,快速收集模型信息,加速了模型构建过程;在利用阶段,通过保留最优值函数的方式复用算法的学习经验,提高了算法迭代计算值函数的效率。仿真实验结果表明,所提方法与原始的E3算法相比,在收敛速度和精度方面都具有很大的提高,与其他两种并行强化学习方法相比也具有很大的性能优势。
- 刘全杨旭东荆玲肖飞
- 关键词:人工智能多AGENT并行采样
- 面向环灾应急的智能决策关键技术研究
- 近年来,随着现代化工企业生产装置密集化、工艺复杂化、产量大型化、产品多元化,大型企业一旦发生环境污染事故,将会对环境和周边人员的人身和财产安全带来巨大的伤害。由于环境污染事故发生突然,应急任务繁多而且时间紧迫,万一处置不...
- 荆玲
- 关键词:数字化预案
- 文献传递
- 突发环境污染事件应急预案数字化方法研究被引量:5
- 2013年
- 针对现有应急预案数字化方法不能很好地实现预案的可视化、动态化和智能化的问题,以及根据突发环境污染事件的具体特征,提出了一套突发环境污染事件应急预案的数字化方法和执行机制。该数字化预案参考了多项综合预案和专项预案,采用基于预案模型的方法,对预案基本对象提取和建模,建立知识库和规则库,方便了预案的自动生成,并且可以根据现场条件动态地调整,使得应急预案在应对突发事件时可视化程度高、适应变化能力强。论文最后通过某化工园数字化预案的实例,展现了本方法的可实施性和可扩展性。
- 蒋浩荆玲武港山
- 关键词:数字化预案应急预案突发环境污染事件
- 智能环灾应急决策支持技术研究
- 2013年
- 针对目前环灾应急决策系统中预案信息化程度低、动态应急能力不足的问题,文中在数字化预案的基础上,提出了一套基于案例推理(CBR)和基于规则推理(RBR)相结合的智能辅助决策机制。鉴于环灾应急事件的复杂性,许多应急处置方案都是基于过去的经验,而且应急过程中又随时有可能出现新的应急目标,文中采用了以CBR方法为主,RBR方法为辅的CR智能辅助决策方法。这种方法能更有效地实现复杂环灾应急的辅助决策需要,最后通过某化工园应急决策实例展示了文中所讨论的方法的过程。
- 蒋浩荆玲武港山
- 关键词:基于案例推理基于规则推理智能决策支持
- 一种基于智能调度的可扩展并行强化学习方法被引量:3
- 2013年
- 针对强化学习在大状态空间或连续状态空间中存在的"维数灾"问题,提出一种基于智能调度的可扩展并行强化学习方法——IS-SRL,并从理论上进行分析,证明其收敛性.该方法采用分而治之策略对大状态空间进行分块,使得每个分块能够调入内存独立学习.在每个分块学习了一个周期之后交换到外存上,调入下一个分块继续学习.分块之间在换入换出的过程中交换信息,以使整个学习任务收敛到最优解.同时针对各分块之间的学习顺序会显著影响学习效率的问题,提出了一种新颖的智能调度算法,该算法利用强化学习值函数更新顺序的分布特点,基于多种调度策略加权优先级的思想,把学习集中在能产生最大效益的子问题空间,保障了IS-SRL方法的学习效率.在上述调度算法中融入并行调度框架,利用多Agent同时学习,得到了IS-SRL方法的并行版本——IS-SPRL方法.实验结果表明,IS-SPRL方法具有较快的收敛速度和较好的扩展性能.
- 刘全傅启明杨旭东荆玲李瑾李娇
- 关键词:并行计算可扩展性智能调度