国家自然科学基金(70802025)
- 作品数:9 被引量:16H指数:2
- 相关作者:韩伟徐立霞王云马福民王俊更多>>
- 相关机构:南京财经大学嘉兴学院更多>>
- 发文基金:国家自然科学基金教育部规划基金项目江苏省教育厅自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 基于模糊推理的多智能体强化学习被引量:1
- 2011年
- 以电子市场智能定价问题为研究背景,提出基于模糊推理的多智能体强化学习算法(FI-MARL)。在马尔科夫博弈学习框架下,将领域知识初始化为一个模糊规则集合,智能体基于模糊规则选择动作,并采用强化学习来强化模糊规则。该方法有效融合应用背景的领域知识,充分利用样本信息并降低学习空间维数,从而增强在线学习性能。在电子市场定价的对比实验中,智能体无论在合作还是在竞争的问题上都表现出较为长远的智能行为,提高了平均定价收益。
- 韩伟鲁霜
- 关键词:模糊推理电子市场
- 电子市场排污权交易的多智能体协商方法
- 2011年
- 为了平衡经济发展和污染治理之间的矛盾,将地理位置相对集中的排污企业建立专业电子市场用于排污权的交易。在控制排污总量的前提下,通过合理安排生产来最大化排污企业的收益。基于市场交互机制,给出了一个多智能体协商框架。每个智能体代表一家企业参与协商,在不暴露企业商业信息前提下,在当前污染物价格下通过规划方法计算污染物需求量。市场端接收每种污染物需求量并计算每种污染物价格,然后作为公共信息加以发布。仿真实验表明,相对于按比例单独缩减排污量,协商结果使得污染企业的个体收益都有所提高,从而增大了社会收益。
- 韩伟宋柱芹
- 关键词:多智能体系统电子市场
- 带贯通约束的不规则排样分阶构造算法被引量:2
- 2012年
- 针对玻璃排样问题,首次研究带贯通性约束的不规则凸多边形的Bin Packing问题.提出一种针对图形组合进行优化的分阶构造算法.该算法能够隐式实现贯通约束,并利用各阶种群之间清晰的组合关系,将多个多边形的形态优化问题转化为一个结构化的多步决策问题,提高了原片利用率.为了控制新组合图形的形状,构造过程引入变动的形状权重,并给出散列函数来控制形状权重的变化.分别用中英双方玻璃厂订单数据进行测试,显示本文算法比二步法等方法平均利用率有较大提高.
- 韩伟马福民
- 关键词:动态规划
- 长记忆过程的参数估计及其在金融市场中的应用
- 2009年
- 文章提出了一种关于长记忆过程的记忆参数的估计方法。运用谱密度的一致估计量来估计自回归滑动平均过程的记忆参数,通过合适窗函数的选择可使得该平滑谱估计的方差变小,比传统的GPH估计更有效。最后,采用实际数据对上述方法进行说明。
- 徐立霞
- 关键词:长记忆性谱密度
- 江苏省能源消费和经济增长因果关系研究被引量:1
- 2012年
- 本文运用协整分析,误差修正模型,格兰杰因果检验,脉冲响应函数和方差分解的方法,对1985—2009年间江苏省能源消费总量和实际GDP的动态关系进行研究。结果表明,长期看来能源消费总量和实际GDP之间存在稳定的静态关系,并且存在从经济增长到能源消费的单向因果关系,说明江苏经济增长能有效的引发能源消费,反之不然。误差修正模型表明系统存在较好的反向修正机制,可以有效调节两者之间的短期偏离;而相应的评价准则说明了该模型具有较强的预测能力。脉冲响应和方差分解的结果也表明在一定的滞后期内,能源消费对经济增长的贡献度或重要性在逐渐降低。所得结论和文献[7]中的结果不同,说明近几年来,随着江苏省能源政策的调整,经济增长对能源的依赖性在逐渐减小,能源利用效率不断提高。最后在研究基础上提出了江苏省经济发展与节能降耗的对策建议。
- 徐立霞李昌峰
- 关键词:GRANGER因果检验脉冲响应方差分解
- 一种基于划分和集成思想的多智能体强化学习被引量:1
- 2008年
- 针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学习性能.
- 王云韩伟
- 关键词:多智能体系统
- 波动率模型在中国股市中的应用研究被引量:8
- 2010年
- 文章对上证综合指数收益率和深证成分指数收益率进行统计分析,运用GARCH,E-GARCH,TARCH模型对其进行建模,发现股票收益率序列所存在的尖峰厚尾现象、波动聚类特性以及杠杆效应,通过比较不同的模型发现非对称模型的拟合效果最为理想;另外通过采用三种不同的损失函数评价各类模型的预测效果,结果表明,非对称模型样本外预测的能力也是最强的。
- 徐立霞
- 关键词:GARCH波动率
- 对称协调博弈问题的多智能体强化学习被引量:2
- 2008年
- 针对多机器人协调问题,利用协调博弈中智能体策略相似性,提出智能体的高阶信念修正模型和学习方法PEL,使智能体站在对手角度进行换位推理,进而根据信念修正将客观观察行为和主观信念推理结合起来。证明了信念修正模型的推理置信度只在0和1两个值上调整即可协调成功。以多机器人避碰为实验背景进行仿真,表明算法比现有方法能够取得更好的协调性能。
- 王云韩伟
- 关键词:多智能体系统协调博弈
- 基于进化算法的多智能体合作学习被引量:1
- 2010年
- 强化学习的收敛速度随状态-动作空间的维数呈指数增长,因此在涉及大的状态空间时,强化学习算法的收敛速度非常慢以至不能满足应用需求。在许多应用环境中,若智能体之间存在合作关系,借助多个智能体进行分布式学习可以部分解决这一问题。利用进化算法,设计了智能体繁殖、消亡等操作,使得子代智能体能够继承父代智能体在状态空间的方向信息,从而更快地找到状态-动作空间的有效更新。仿真实验表明:算法比已有的强化学习方法具有更高的搜索效率和收敛速度。
- 王云王俊韩伟
- 关键词:多智能体系统进化算法