李娇
- 作品数:7 被引量:41H指数:3
- 供职机构:苏州大学计算机科学与技术学院更多>>
- 发文基金:江苏省高校自然科学研究项目江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于线性函数逼近的离策略Q(λ)算法被引量:25
- 2014年
- 将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点.针对传统的基于查询表及函数逼近的Q(λ)学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题,提出一种基于线性函数逼近的离策略Q(λ)算法.该算法通过引入重要性关联因子,在迭代次数逐步增长的过程中,使得在策略与离策略相统一,确保算法的收敛性.同时在保证在策略与离策略的样本数据一致性的前提下,对算法的收敛性给予理论证明.将文中提出的算法用于Baird反例、Mountain-Car及Random Walk仿真平台,实验结果表明,该算法与传统的基于函数逼近的离策略算法相比,具有较好的收敛性;与传统的基于查询表的算法相比,具有更快的收敛速度,且对于状态空间的增长具有较强的鲁棒性.
- 傅启明刘全王辉肖飞于俊李娇
- 关键词:函数逼近
- 分布式数据库中基于局部CON模型的记录匹配方法被引量:4
- 2011年
- 针对现有记录匹配方法需要相关领域专家大量的人工参与或严重依赖于启发式规则,且无法处理大规模数据的问题,提出一种基于局部CON模型的记录匹配方法。该方法利用关联规则发现算法挖掘匹配依赖,将匹配依赖和数据实例同时作为改进型tableau的输入,检测匹配得出结果。实验结果和理论分析表明,该方法能快速识别出分布式记录匹配情况,且不需要人工参与,效率有非常明显的提高。
- 李娇刘全傅启明王庭钢
- 关键词:分布式数据库TABLEAU
- 分布式数据库中基于局部CON模型的记录匹配方法
- 针对现有记录匹配方法需要相关领域专家大量的人工参与或严重依赖于启发式规则,且无法处理大规模数据的问题,提出一种基于局部CON模型的记录匹配方法。该方法利用关联规则发现算法挖掘匹配依赖,将匹配依赖和数据实例同时作为改进型t...
- 李娇刘全傅启明王庭钢
- 关键词:分布式数据库
- 基于tableau的数据记录匹配及一致性研究
- 数据质量已被公认为是数据管理的首要问题之一。针对数据质量管理领域的数据记录不匹配及不一致问题,本文分别从记录匹配检测及不一致修复两个角度出发,提出了基于CON模型的记录匹配方法和基于tableau的自动检测及修复不一致数...
- 李娇
- 关键词:数据质量TABLEAU
- 文献传递
- 一种基于智能调度的可扩展并行强化学习方法被引量:3
- 2013年
- 针对强化学习在大状态空间或连续状态空间中存在的"维数灾"问题,提出一种基于智能调度的可扩展并行强化学习方法——IS-SRL,并从理论上进行分析,证明其收敛性.该方法采用分而治之策略对大状态空间进行分块,使得每个分块能够调入内存独立学习.在每个分块学习了一个周期之后交换到外存上,调入下一个分块继续学习.分块之间在换入换出的过程中交换信息,以使整个学习任务收敛到最优解.同时针对各分块之间的学习顺序会显著影响学习效率的问题,提出了一种新颖的智能调度算法,该算法利用强化学习值函数更新顺序的分布特点,基于多种调度策略加权优先级的思想,把学习集中在能产生最大效益的子问题空间,保障了IS-SRL方法的学习效率.在上述调度算法中融入并行调度框架,利用多Agent同时学习,得到了IS-SRL方法的并行版本——IS-SPRL方法.实验结果表明,IS-SPRL方法具有较快的收敛速度和较好的扩展性能.
- 刘全傅启明杨旭东荆玲李瑾李娇
- 关键词:并行计算可扩展性智能调度
- 一种动态挥发率和启发式修正的蚁群优化算法被引量:10
- 2012年
- 群体智能的研究为分布式控制和优化提供了更好的方法,以蚁群算法为代表的群体智能已经得到了大量的研究,并广泛应用于组合优化领域.但是在求解组合优化问题特别是在求解规模较大的问题时,收敛速度慢、易于停滞等现象仍然制约算法的广泛应用.为此,提出了DEAHACO算法,该算法提出动态挥发率机制,用以更好地平衡求解效率和求解质量之间的矛盾,避免算法陷入局部最优;同时,为了加快算法的收敛速度,对启发式信息进行了重新定义,以指导算法快速收敛;最后,引入了边界对称变异策略对迭代结果进行对称变异,既提高了变异效率,也改进了变异质量.实验表明,该算法与其他算法相比,其收敛速度提高了20%以上,同时算法在其他一些经典的TSP问题上也表现出很好的性能.
- 刘全陈浩张永刚李娇张沈斌
- 关键词:蚁群优化
- 基于tableau结点封闭值的非一致性数据库开放分支修复方法
- 2013年
- 在将tableau方法扩展到非一致性数据库修复的基础上,提出一种新的利用分支封闭值修复数据库的方法。该方法结合tableau分析法的开放和封闭推理标准,以开放公式树TP(IC∪r)分支为基础,为公式树TP(IC∪r)中每个结点引入一个结点封闭值。根据TP(IC∪r)中结点封闭值的定义,通过计算TP(IC∪r)的结点封闭值来选择分支进行开放修复,从而可以直接确定数据库的修复实例,同时考虑了含有I封闭的修复,将开放修复扩展到含有I封闭的TP(IC∪r),并给予逻辑证明。最后,对于一致性应答结果的逻辑特征予以证明。
- 高龙刘全傅启明李娇
- 关键词:TABLEAU非一致性数据库