公共文化服务平台

2024年12月12日星期四

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

国家自然科学基金(70802025): 作品数：9 被引量：16H指数：2; 相关作者：韩伟徐立霞王云马福民王俊更多>>; 相关机构：南京财经大学嘉兴学院更多>>; 发文基金：国家自然科学基金教育部规划基金项目江苏省教育厅自然科学基金更多>>; 相关领域：自动化与计算机技术经济管理更多>>

相关作品
相关人物
相关机构
相关资助
相关领域

文献类型

9篇中文期刊文章

领域

6篇自动化与计算...
3篇经济管理

主题

5篇智能体
5篇智能体系统
5篇多智能
5篇多智能体
5篇多智能体系
5篇多智能体系统
3篇多智能体强化...
2篇电子市场
1篇动态规划
1篇因果
1篇因果关系
1篇因果关系研究
1篇因果检验
1篇中国股市
1篇能源
1篇能源消费
1篇排污
1篇排污权
1篇排污权交易
1篇谱密度

机构

9篇南京财经大学
1篇嘉兴学院

作者

6篇韩伟
3篇王云
3篇徐立霞
1篇马福民
1篇鲁霜
1篇宋柱芹
1篇李昌峰
1篇王俊

传媒

2篇统计与决策
2篇计算机工程与...
1篇计算机应用与...
1篇小型微型计算...
1篇山东大学学报...
1篇南京财经大学...
1篇南京师范大学...

年份

2篇2012
2篇2011
2篇2010
1篇2009
2篇2008

共 9 条记录，以下是 1-9

全选清除导出

排序方式：

基于模糊推理的多智能体强化学习被引量：1: 2011年; 以电子市场智能定价问题为研究背景,提出基于模糊推理的多智能体强化学习算法(FI-MARL)。在马尔科夫博弈学习框架下,将领域知识初始化为一个模糊规则集合,智能体基于模糊规则选择动作,并采用强化学习来强化模糊规则。该方法有效融合应用背景的领域知识,充分利用样本信息并降低学习空间维数,从而增强在线学习性能。在电子市场定价的对比实验中,智能体无论在合作还是在竞争的问题上都表现出较为长远的智能行为,提高了平均定价收益。; 韩伟鲁霜; 关键词：模糊推理电子市场

电子市场排污权交易的多智能体协商方法: 2011年; 为了平衡经济发展和污染治理之间的矛盾,将地理位置相对集中的排污企业建立专业电子市场用于排污权的交易。在控制排污总量的前提下,通过合理安排生产来最大化排污企业的收益。基于市场交互机制,给出了一个多智能体协商框架。每个智能体代表一家企业参与协商,在不暴露企业商业信息前提下,在当前污染物价格下通过规划方法计算污染物需求量。市场端接收每种污染物需求量并计算每种污染物价格,然后作为公共信息加以发布。仿真实验表明,相对于按比例单独缩减排污量,协商结果使得污染企业的个体收益都有所提高,从而增大了社会收益。; 韩伟宋柱芹; 关键词：多智能体系统电子市场

带贯通约束的不规则排样分阶构造算法被引量：2: 2012年; 针对玻璃排样问题,首次研究带贯通性约束的不规则凸多边形的Bin Packing问题.提出一种针对图形组合进行优化的分阶构造算法.该算法能够隐式实现贯通约束,并利用各阶种群之间清晰的组合关系,将多个多边形的形态优化问题转化为一个结构化的多步决策问题,提高了原片利用率.为了控制新组合图形的形状,构造过程引入变动的形状权重,并给出散列函数来控制形状权重的变化.分别用中英双方玻璃厂订单数据进行测试,显示本文算法比二步法等方法平均利用率有较大提高.; 韩伟马福民; 关键词：动态规划

长记忆过程的参数估计及其在金融市场中的应用: 2009年; 文章提出了一种关于长记忆过程的记忆参数的估计方法。运用谱密度的一致估计量来估计自回归滑动平均过程的记忆参数,通过合适窗函数的选择可使得该平滑谱估计的方差变小,比传统的GPH估计更有效。最后,采用实际数据对上述方法进行说明。; 徐立霞; 关键词：长记忆性谱密度

江苏省能源消费和经济增长因果关系研究被引量：1: 2012年; 本文运用协整分析,误差修正模型,格兰杰因果检验,脉冲响应函数和方差分解的方法,对1985—2009年间江苏省能源消费总量和实际GDP的动态关系进行研究。结果表明,长期看来能源消费总量和实际GDP之间存在稳定的静态关系,并且存在从经济增长到能源消费的单向因果关系,说明江苏经济增长能有效的引发能源消费,反之不然。误差修正模型表明系统存在较好的反向修正机制,可以有效调节两者之间的短期偏离;而相应的评价准则说明了该模型具有较强的预测能力。脉冲响应和方差分解的结果也表明在一定的滞后期内,能源消费对经济增长的贡献度或重要性在逐渐降低。所得结论和文献[7]中的结果不同,说明近几年来,随着江苏省能源政策的调整,经济增长对能源的依赖性在逐渐减小,能源利用效率不断提高。最后在研究基础上提出了江苏省经济发展与节能降耗的对策建议。; 徐立霞李昌峰; 关键词：GRANGER因果检验脉冲响应方差分解

一种基于划分和集成思想的多智能体强化学习被引量：1: 2008年; 针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学习性能.; 王云韩伟; 关键词：多智能体系统

波动率模型在中国股市中的应用研究被引量：8: 2010年; 文章对上证综合指数收益率和深证成分指数收益率进行统计分析,运用GARCH,E-GARCH,TARCH模型对其进行建模,发现股票收益率序列所存在的尖峰厚尾现象、波动聚类特性以及杠杆效应,通过比较不同的模型发现非对称模型的拟合效果最为理想;另外通过采用三种不同的损失函数评价各类模型的预测效果,结果表明,非对称模型样本外预测的能力也是最强的。; 徐立霞; 关键词：GARCH 波动率

对称协调博弈问题的多智能体强化学习被引量：2: 2008年; 针对多机器人协调问题,利用协调博弈中智能体策略相似性,提出智能体的高阶信念修正模型和学习方法PEL,使智能体站在对手角度进行换位推理,进而根据信念修正将客观观察行为和主观信念推理结合起来。证明了信念修正模型的推理置信度只在0和1两个值上调整即可协调成功。以多机器人避碰为实验背景进行仿真,表明算法比现有方法能够取得更好的协调性能。; 王云韩伟; 关键词：多智能体系统协调博弈

基于进化算法的多智能体合作学习被引量：1: 2010年; 强化学习的收敛速度随状态-动作空间的维数呈指数增长,因此在涉及大的状态空间时,强化学习算法的收敛速度非常慢以至不能满足应用需求。在许多应用环境中,若智能体之间存在合作关系,借助多个智能体进行分布式学习可以部分解决这一问题。利用进化算法,设计了智能体繁殖、消亡等操作,使得子代智能体能够继承父代智能体在状态空间的方向信息,从而更快地找到状态-动作空间的有效更新。仿真实验表明:算法比已有的强化学习方法具有更高的搜索效率和收敛速度。; 王云王俊韩伟; 关键词：多智能体系统进化算法

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张