2024年11月25日
星期一
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
王三强
作品数:
1
被引量:4
H指数:1
供职机构:
中国人民解放军65631部队
更多>>
发文基金:
国家重点基础研究发展计划
更多>>
相关领域:
电子电信
更多>>
合作作者
阚兴一
中国人民解放军
刘鑫
解放军理工大学通信工程学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
电子电信
主题
1篇
认知无线
1篇
认知无线网络
1篇
网络
1篇
无线
1篇
无线网
1篇
无线网络
1篇
分布式
1篇
分布式网络
1篇
Q学习
1篇
MARKOV...
1篇
博弈
1篇
博弈框架
1篇
MARL
机构
1篇
解放军理工大...
1篇
中国人民解放...
1篇
中国人民解放...
作者
1篇
刘鑫
1篇
王三强
1篇
阚兴一
传媒
1篇
辽宁工程技术...
年份
1篇
2011
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
认知无线网络中基于随机博弈框架的频率分配
被引量:4
2011年
为了解决认知无线网络中分布式的动态频率分配问题,采用随机博弈的框架,将认知链路建模成自私理性的智能体,并提出了一种以最大化平均Q函数为目标的多智能体学习算法—MAQ。通过MAQ学习,分布式的智能体可以实现间接的协商而不需要交互Q函数和回报值,因为智能体的决策过程需要考虑其他用户的决策。理论证明了MAQ学习算法的收敛性。仿真结果表明,MAQ算法的吞吐量性能接近中心式的学习算法,但是MAQ只需要较少的信息交互。
刘鑫
阚兴一
王三强
关键词:
MARL
Q学习
分布式网络
MARKOV过程
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张