您的位置: 专家智库 > >

国际科技合作与交流专项项目(2011FA10440)

作品数:7 被引量:15H指数:2
相关作者:唐昊周雷谭琦丁轲李博川更多>>
相关机构:合肥工业大学合肥华耀电子工业有限公司教育部更多>>
发文基金:国际科技合作与交流专项项目国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
相关领域:自动化与计算机技术理学电子电信更多>>

文献类型

  • 7篇期刊文章
  • 3篇会议论文

领域

  • 7篇自动化与计算...
  • 2篇理学
  • 1篇电子电信

主题

  • 4篇站点
  • 4篇Q学习
  • 3篇半MARKO...
  • 2篇优化控制
  • 2篇网络
  • 1篇动目标
  • 1篇动目标检测
  • 1篇多工序
  • 1篇信息交互
  • 1篇运动目标检测
  • 1篇中继
  • 1篇中继选择
  • 1篇中继选择算法
  • 1篇神经网
  • 1篇神经网络
  • 1篇吞吐
  • 1篇吞吐量
  • 1篇网络生命周期
  • 1篇网络吞吐量
  • 1篇小脑模型

机构

  • 10篇合肥工业大学
  • 1篇教育部
  • 1篇合肥华耀电子...

作者

  • 9篇唐昊
  • 8篇周雷
  • 3篇谭琦
  • 2篇江琦
  • 1篇韩江洪
  • 1篇孔凤
  • 1篇张建军
  • 1篇苏红
  • 1篇张晓艳
  • 1篇裴荣
  • 1篇刘冰
  • 1篇李博川
  • 1篇丁轲
  • 1篇许玲玲

传媒

  • 2篇控制理论与应...
  • 1篇自动化学报
  • 1篇计算机学报
  • 1篇电子技术(上...
  • 1篇计算机工程与...
  • 1篇计算机工程与...

年份

  • 1篇2016
  • 3篇2015
  • 2篇2014
  • 2篇2013
  • 1篇2012
  • 1篇2011
7 条 记 录,以下是 1-10
排序方式:
无线协作网络中的能量有效性中继选择算法被引量:1
2013年
研究了无线协作网络中的中继选择问题,允许中继具有缓存数据的能力,提出了一种带有buffer的能量有效性中继选择算法,以延长网络生命周期并提高系统吞吐量。该算法综合考虑链路信息,中继的队列状态以及节点的剩余能量信息,通过加权效用公式选择最优接收数据中继与最优发送数据中继。考虑源节点与中继节点间的功率分配,以降低因源节点到中继节点以及中继节点到目的节点间的信道速率不一致所引起的系统丢包率。仿真实验结果表明,该算法有效地延长了网络的生命周期,随着中继个数的增加网络吞吐量有明显的提高,考虑功率分配后,有效降低了系统丢包率。
苏红唐昊周雷江琦
关键词:中继选择网络吞吐量网络生命周期功率分配
服务率可变的单站点CSPS系统优化控制
研究一类服务率可变的单站点传送带给料生产加工站(Conveyor-Serviced Producvion Stavion,简称为CSPS)的优化控制问题。在实际生产中,服务率可变反映了生产中劳动强度的变化,也是调整系统生...
庆琪琛唐昊周雷江琦
关键词:半MARKOV决策过程
文献传递
基于CMAC神经网络的多工序CSPS系统分层优化控制
2012年
研究带有柔性站点的多工序传送带给料加工站系统的优化控制问题。根据系统运行特点,文章把系统分为切换控制和Look-ahead协同控制两层决策。首先,对于上层的柔性站点切换控制问题,根据CMAC神经网络收敛速度快,适应能力强的特点,采用基于CMAC神经网络的Q学习算法进行策略优化,解决工序间控制问题;其次,对于下层的Look-ahead协同控制问题,运用Wolf-PHC多Agent学习算法,解决工序内协同问题。实验结果表明,通过引入柔性站点建立两层决策体系,整个系统的工件处理率明显提高,基于CMAC神经网络的Q学习算法收敛速度更快,空间复杂度更低。
刘冰唐昊周雷
关键词:多工序多AGENT系统CMAC
基于连续时间半马尔可夫决策过程的Option算法被引量:2
2014年
针对大规模或复杂的随机动态规划系统,可利用其分层结构特点或引入分层控制方式,借助分层强化学习(Hierarchical Reinforcement Learning,HRL)来解决其"维数灾"和"建模难"问题.HRL归属于样本数据驱动优化方法,通过空间/时间抽象机制,可有效加速策略学习过程.其中,Option方法可将系统目标任务分解成多个子目标任务来学习和执行,层次化结构清晰,是具有代表性的HRL方法之一.传统的Option算法主要是建立在离散时间半马尔可夫决策过程(Semi-Markov Decision Processes,SMDP)和折扣性能准则基础上,无法直接用于解决连续时间无穷任务问题.因此本文在连续时间SMDP框架及其性能势理论下,结合现有的Option算法思想,运用连续时间SMDP的相关学习公式,建立一种适用于平均或折扣性能准则的连续时间统一Option分层强化学习模型,并给出相应的在线学习优化算法.最后通过机器人垃圾收集系统为仿真实例,说明了这种HRL算法在解决连续时间无穷任务优化控制问题方面的有效性,同时也说明其与连续时间模拟退火Q学习相比,具有节约存储空间、优化精度高和优化速度快的优势.
唐昊张晓艳韩江洪周雷
关键词:分层强化学习Q学习
可变服务率模式下基于需求驱动的传送带给料加工站系统的优化控制被引量:2
2015年
本文主要研究可变服务率模式下基于需求驱动的传送带给料加工站(CSPS)系统的优化控制问题,主要目标是对系统的随机优化控制问题进行建模和提供解决方案.论文以缓冲库和成品库剩余容量为联合状态,以站点前视距离和工件服务率为控制变量,将其最优控制问题描述为半马尔科夫决策过程(SMDP)模型.该模型为利用策略迭代等方法求解系统在平均准则或折扣准则下的最优控制策略提供了理论基础,特别地,据此可引入基于模拟退火思想的Q学习算法等优化方法来寻求近似解,以克服理论求解过程中的维数灾和建模难等困难.仿真结果说明了本文建立的数学模型及给出的优化方法的有效性.
唐昊许玲玲周雷谭琦
关键词:Q学习
小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用被引量:3
2011年
研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系统前视距离为连续变量的优化控制问题,将小脑模型关节控制器网络的Q值函数逼近与在线学习技术相结合,给出了在线Q学习及模型无关的在线策略迭代算法.仿真结果表明,文中算法提高了学习速度和优化精度.
周雷孔凤唐昊张建军
关键词:小脑模型关节控制器Q学习
结合阴影抑制的混合高斯模型改进算法被引量:6
2016年
混合高斯模型背景法作为运动目标检测的一种经典方法,已经广泛应用于智能视频监控系统中。但是,传统的混合高斯模型背景法容易将阴影误检测为运动目标的一部分。因此,针对该方法在区分阴影和运动目标方面的不足,提出了一种将混合高斯模型背景法和HSV空间阴影抑制相结合的运动目标检测算法。这种改进算法首先将颜色空间转换到HSV空间,初步提取运动目标,然后再利用阴影的灰度值比背景中的灰度值小,而前景的灰度值比背景中灰度值大的特性,检测出运动目标中的阴影。实验结果表明,这种改进的算法明显提高了检测效果,有效抑制了阴影对运动目标检测的干扰,算法实时性也较好。
李博川丁轲
关键词:运动目标检测混合高斯模型HSV空间
基于工件流信息的一种多站点CSPS的协同控制方法
研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)的协同优化控制,对站点间的协作问题进行建模和优化。目标是通过合理选择每个站点的控制策略,改善各工作站的负...
盛文学唐昊周雷谭琦
关键词:多站点
文献传递
面向多品种部件的单站点CSPS系统优化控制模型
主要研究了一类多个品种工件到达的单站点传送带给料加工站(CSPS)的优化控制问题。该系统中,不同品种工件按照独立泊松过程随机到达并独立存放在相应品种的缓冲库中,各品种工件的加工时间服从不同参数的Erlang分布。本文采用...
周旸旻唐昊周雷李博川
关键词:半MARKOV决策过程
文献传递
基于状态聚类的多站点CSPS系统的协同控制方法被引量:1
2014年
单站点传送带给料加工站(Conveyor-serviced production station,CSPS)系统中,可运用强化学习对状态–行动空间进行有效探索,以搜索近似最优的前视距离控制策略.但是多站点CSPS系统的协同控制问题中,系统状态空间的大小会随着站点个数的增加和缓存库容量的增加而成指数形式(或几何级数)增长,从而导致维数灾,影响学习算法的收敛速度和优化效果.为此,本文在站点局域信息交互机制的基础上引入状态聚类的方法,以减小每个站点学习空间的大小和复杂性.首先,将多个站点看作相对独立的学习主体,且各自仅考虑邻近下游站点的缓存库的状态并纳入其性能值学习过程;其次,将原状态空间划分成多个不相交的子集,每个子集用一个抽象状态表示,然后,建立基于状态聚类的多站点反馈式Q学习算法.通过该方法,可在抽象状态空间上对各站点的前视距离策略进行优化学习,以寻求整个系统的生产率最大.仿真实验结果说明,与一般的多站点反馈式Q学习方法相比,基于状态聚类的多站点反馈式Q学习方法不仅具有收敛速度快的优点,而且还在一定程度上提高了系统生产率.
唐昊裴荣周雷谭琦
共1页<1>
聚类工具0