公共文化服务平台

2024年12月4日星期三

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

李兆斌: 作品数：4 被引量：22H指数：2; 供职机构：国防科学技术大学机电工程与自动化学院更多>>; 发文基金：国家自然科学基金教育部“新世纪优秀人才支持计划”霍英东青年教师基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

吴军国防科学技术大学机电工程与自动...
徐昕国防科学技术大学机电工程与自动...
刘春明国防科学技术大学机电工程与自动...
连传强国防科学技术大学机电工程与自动...
黄岩国防科学技术大学机电工程与自动...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

4篇中文期刊文章

领域

4篇自动化与计算...

主题

1篇导航方法
1篇学习算法
1篇移动机器人
1篇增强学习算法
1篇值函数
1篇智能体
1篇智能体系统
1篇主车
1篇资源分配
1篇自主车
1篇自主车辆
1篇协同控制
1篇面向资源
1篇环境感知
1篇机器人
1篇交通仿真
1篇函数
1篇多智能
1篇多智能体
1篇多智能体强化...

机构

4篇国防科学技术...

作者

4篇吴军
4篇李兆斌
3篇徐昕
2篇刘春明
2篇连传强
1篇左磊
1篇黄振华
1篇黄岩

传媒

1篇计算机应用研...
1篇兵工自动化
1篇中南大学学报...
1篇智能系统学报

年份

1篇2013
1篇2011
2篇2010

共 4 条记录，以下是 1-4

全选清除导出

排序方式：

自主车辆发展概况及关键技术被引量：13: 2010年; 为了更有效地开发新型自主车辆,对自主车辆发展概况及关键技术进行研究。简述了自主车辆的相关概念及其优缺点,详细介绍了当前国内外无人自主车辆的研究发展现状,分析了自主车辆的结构组成,并分别阐述了环境感知、定位导航、规划决策、控制体系和交通仿真五大模块的关键技术,最后提出了自主车辆未来的发展趋势及需要努力的方向。; 黄岩吴军刘春明李兆斌; 关键词：自主车辆环境感知交通仿真

基于LSPI和滚动窗口的移动机器人反应式导航方法被引量：6: 2013年; 结合最小二乘策略迭代(Least-squares policy iteration,LSPI)的算法特性和基于滚动窗口的实时重规划,提出一种新的基于LSPI和滚动窗口的反应式导航学习控制方法。仿真和实验结果表明:该方法对移动机器人在未知环境中的运动控制有效,并且对未知环境具有自适应性。; 刘春明李兆斌黄振华左磊吴军徐昕; 关键词：移动机器人

增强学习算法的性能测试与对比分析被引量：2: 2010年; 研究了几类典型增强学习算法的性能评估问题,包括Q-学习算法、最小二乘策略迭代(LSPI)和基于核的最小二乘策略迭代(KLSPI)算法等,重点针对Markov决策问题(MDP)的值函数平滑特性对算法性能的影响进行了研究。分别利用值函数非平滑的组合优化问题——旅行商问题(TSP)和值函数平滑的Mountain-Car运动控制问题,对不同增强学习算法的性能进行了测试和比较分析。分析了三种算法针对不同类型问题的各自特点,通过实验对比,验证了近似策略迭代算法,特别是KLSPI算法在解决值函数平滑的序贯决策问题时性能更优。通过分析实验结果表明,MDP值函数的平滑程度是影响近似策略迭代算法性能表现的重要因素。; 李兆斌徐昕吴军连传强; 关键词：值函数

面向资源分配问题的Q-CF多智能体强化学习被引量：1: 2011年; 多智能体强化学习算法在用于复杂的分布式系统时存在着状态空间大、学习效率低等问题.针对网络环境中的资源分配问题对多智能体强化学习算法进行了研究,将Q-学习算法和链式反馈(chain feedback,CF)学习算法相结合,提出了Q-CF多智能体强化学习算法,利用一种称为信息链式反馈的机制实现了多智能体之间的高效协同.仿真结果表明,和已有的多智能体Q-学习算法相比,该方法具有更加快速的收敛速度,同时保证了协同策略的性能优化.; 连传强徐昕吴军李兆斌; 关键词：多智能体系统资源分配协同控制

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张