刘亮 作品数:20 被引量:19 H指数:3 供职机构: 安徽大学 更多>> 发文基金: 国家自然科学基金 安徽省高等学校优秀青年人才基金 安徽省自然科学基金 更多>> 相关领域: 自动化与计算机技术 经济管理 政治法律 电子电信 更多>>
分层的局部合作Q-学习 2009年 多智能体Q-学习问题往往因为联合动作的个数指数级增长而变得无法解决。从研究分层强化学习入手,通过对强化学习中合作MAS的研究,在基于系统工作逻辑的研究基础上,提出了基于学习过程分层的局部合作强化学习,通过对独立Agent强化学习的知识考察,改进多Agent系统学习的效率,进一步提高了局部合作强化学习的效能。从而解决强化学习中的状态空间的维数灾难,并通过仿真足球的2vs1防守证明了算法的有效性。 刘亮 李龙澍关键词:多智能体系统 Q-学习 从现代悲剧的三重世界论尤金·奥尼尔对悲剧的创新 本文旨在探讨奥尼尔对悲剧的革新。自从尼采断言悲剧己经死亡,悲剧的涵义、甚至悲剧存在与否一直是颇具有争论性的问题。奥尼尔的悲剧也是争论的焦点。本文首先分析了历史上影响深远的三大悲剧理论,找出定义悲剧的核心标准——净化作用、... 刘亮关键词:现代悲剧 美国剧作家 文献传递 多Agent系统中强化学习的研究与应用 本文研究的重点是在多Agent技术环境下探讨强化学习技术的原理以及如何改进其学习效率并提高其算法的合理性,在此研究基础上构建基于矢量势能场的区域合作的强化学习算法和基于任务与过程的分层强化学习算法,这些算法在RoboCu... 刘亮关键词:多AGENT系统 人工智能 Q-学习算法 文献传递 基于神经网络的RoboCup进攻策略 被引量:8 2005年 机器人足球赛Robocup(Robot World Cup)是国际上规模最大且影响最为广泛的机器人足球赛事。机器人足球比赛已经成为当前人工智能研究的热点之一,作为多Agent系统的一个理想的试验平台,它涉及到了多个技术领域。文章应用神经网络技术解决Robocup仿真组比赛的进攻策略问题,对射门底层技术进行了有效优化。我们把这种策略与以往的基于逻辑准则的策略进行了比较。基于神经网络的优化射门策略在很多情况下会做出更好的决定。 刘亮 李龙澍关键词:神经网络 ROBOCUP 国有商业银行人力资源管理与企业绩效关系研究 在当今知识经济时代,人力资源作为企业第一资源早已成为共识,然而,我国的人力资源管理还处于起步阶段,对两者之间关系的研究较少,研究结论也不一致,以国有商业银行为对象进行研究更是寥寥无几。国有商业银行作为我国银行业的核心,影... 刘亮关键词:商业银行 人力资源管理 企业绩效 正相关关系 文献传递 新型功能材料在种衣剂中的应用研究 种衣剂是一种用于农作物种子处理的、具有成膜特性的农药制剂。成膜剂是种衣剂的重要成分,具有保证种衣剂具有一定的粘度、良好的成膜性及适宜的均匀度,维持种衣剂的物理化学性质、控制活性成分缓释的作用。许多高分子材料都具有优异的成... 刘亮关键词:功能材料 种衣剂 农药制剂 成膜剂 乳液聚合 文献传递 未决被羁押人的权利保障研究 未决羁押是指为了确保诉讼程序顺利进行,在法院作出生效判决以前,由专门机关依法暂时将犯罪嫌疑人、被告人置于特定的场所,剥夺其人身自由的强制措施。未决羁押具有强制性、例外性、临时性和法定性。作为刑事诉讼中的重要制度,未决羁押... 刘亮关键词:未决羁押 权利保障 审查程序 文献传递 隐名股东权益保护研究 在股权代持中,隐名出资人的合法权益如何保护,理论界和实务界一直是争议不断。我国涉及隐名出资的现行法律法规当中,《公司法司法解释三》是当前法律位阶最高的法律规范,隐名出资无法可依的局面甚为尴尬。理论界尚未达成一致的认识,实... 刘亮关键词:隐名股东 权益保护 基于模态竞争协同网络的可见光红外目标跟踪方法及装置 本发明公开一种基于模态竞争协同网络的可见光红外目标跟踪方法及装置,方法包括:以所要跟踪当前帧的上一帧中目标预测位置为中心,生成第一候选样本集合;将第一候选样本集合输入至训练好的跟踪模型,得到当前帧的目标跟踪结果;跟踪模型... 刘亮 李成龙 王亮 黄岩 鹿安东 纪晴文献传递 基于元学习参数转移的可见光红外视觉跟踪方法 本发明公开了基于元学习参数转移的可见光红外视觉跟踪方法,所述方法包括:构建多模态视觉跟踪控制模型;将样本输入多模态视觉跟踪控制模型对其进行训练,样本包括多个热红外图像和其对应的可见光图像形成的多个图像对以及多个单独的可见... 纪晴 李成龙 王亮 张彰 鹿安东 刘亮文献传递