沈键
- 作品数:11 被引量:19H指数:2
- 供职机构:上海交通大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种基于双向模型的强化学习方法
- 一种基于双向模型的强化学习方法,用于机器人控制,其特征在于,包括:正向模型、反向模型、正向策略、反向策略,从某真实的状态开始,双向地生成轨迹,在三个阶段不断进行迭代:数据搜集阶段、模型学习阶段、策略优化阶段,直到算法收敛...
- 张伟楠赖行沈键
- 基于滚动时间窗的动态协同过滤推荐模型及算法被引量:9
- 2013年
- 为了提高传统的协同过滤推荐系统的性能,首次提出了考虑时序性的基于滚动时间窗的用户-项目-时间三维动态模型,并在此基础上研究了针对该模型的协同过滤推荐算法。该模型算法对不同时间的兴趣评分按时间序列处理,用户兴趣相似度由不同时间段的分量组合而成,提高了算法的时效性;进而推导出了该模型的增量算法,利用增量算法减少了计算相似度的时间复杂度,从而提高了算法的扩展性;最后设计了合理的实验,实验结果表明提出的三维动态模型及算法在命中率性能上优于传统的二维协同过滤推荐模型及算法。
- 沈键杨煜普
- 关键词:协同过滤时间序列
- 一种基于自适应模型的机器人强化学习方法
- 本发明提出了一种基于自适应模型的机器人强化学习方法,在正常学习一个环境模型的同时,加入模型自适应的步骤,从而可以达到提升虚拟数据准确性的效果。具体来说,当模型是一个神经网络结构,模型自适应通过减小真实数据和虚拟数据在网络...
- 张伟楠沈键赵晗
- 文献传递
- 基于二阶段相似度学习的协同过滤推荐算法被引量:8
- 2013年
- 针对传统的基于最近邻协同过滤推荐算法中计算相似度存在的缺陷,提出了一种基于二阶段相似度学习的协同过滤推荐算法,该算法旨在通过较少的迭代计算改善推荐算法性能。它以既约梯度法迭代寻优为主、最近邻算法为辅,通过邻居的海选和精选,最终提高了相似度的计算精度,改善了误差性能。实验表明,在一定条件下该算法不仅在误差性能上优于传统的推荐算法,而且其算法收敛速度快,可实现相似度参数动态调整和分布式计算。
- 沈键杨煜普
- 关键词:协同过滤K-最近邻算法
- 一种基于模型强化学习的自动超参数调节方法
- 本发明公开了一种基于模型强化学习的自动超参数调节方法,涉及强化学习方法领域。本发明提出将超参数的调节过程建模为一个新的马尔科夫决策过程,再使用强化学习的方法训练一个超参数控制器。该超参数控制器可以根据当前训练阶段的各种状...
- 张伟楠赖行沈键
- 一种基于模型的多智能体强化学习方法
- 本发明公开了一种基于模型的多智能体强化学习方法,属于多智能体强化学习领域,包括对多智能体环境和策略建模,生成多智能体的虚拟轨迹,利用虚拟轨迹更新多智能体的策略。本发明中各智能体分布式进行决策,分别对多智能体环境与对手智能...
- 张伟楠王锡淮沈键周铭
- 一种基于双向模型的强化学习方法
- 一种基于双向模型的强化学习方法,用于机器人控制,其特征在于,包括:正向模型、反向模型、正向策略、反向策略,从某真实的状态开始,双向地生成轨迹,在三个阶段不断进行迭代:数据搜集阶段、模型学习阶段、策略优化阶段,直到算法收敛...
- 张伟楠赖行沈键
- 一种基于模型强化学习的自动超参数调节方法
- 本发明公开了一种基于模型强化学习的自动超参数调节方法,涉及强化学习方法领域。本发明提出将超参数的调节过程建模为一个新的马尔科夫决策过程,再使用强化学习的方法训练一个超参数控制器。该超参数控制器可以根据当前训练阶段的各种状...
- 张伟楠赖行沈键
- 文献传递
- 一种基于自适应模型的机器人强化学习方法
- 本发明提出了一种基于自适应模型的机器人强化学习方法,在正常学习一个环境模型的同时,加入模型自适应的步骤,从而可以达到提升虚拟数据准确性的效果。具体来说,当模型是一个神经网络结构,模型自适应通过减小真实数据和虚拟数据在网络...
- 张伟楠沈键赵晗
- 电子商务的个性化协同过滤推荐算法研究
- 协同过滤技术是推荐系统中应用最广泛的一种个性化推荐技术,因而得到了众多科研人员的青睐。本文以协同过滤推荐算法为主要研究对象,针对协同过滤推荐算法在实际应用中面临的准确性、扩展性、数据稀疏性和实时动态性等几个关键性问题进行...
- 沈键
- 关键词:电子商务协同过滤个性化推荐