公共文化服务平台

2024年11月23日星期六

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

沈键: 作品数：11 被引量：19H指数：2; 供职机构：上海交通大学更多>>; 发文基金：国家高技术研究发展计划更多>>; 相关领域：自动化与计算机技术文化科学更多>>

合作作者

杨煜普上海交通大学
周铭上海交通大学
王锡淮上海交通大学

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

8篇专利
2篇期刊文章
1篇学位论文

领域

6篇自动化与计算...
2篇文化科学

主题

6篇强化学习方法
6篇采样效率
4篇机器人
3篇协同过滤
2篇迭代
2篇虚拟数据
2篇智能体
2篇数据搜集
2篇自适
2篇自适应
2篇自适应模型
2篇协同过滤推荐
2篇决策过程
2篇环境模型
2篇回报
2篇机器人控制
2篇多智能
2篇多智能体
2篇超参数
1篇电子商务

机构

11篇上海交通大学

作者

11篇沈键
2篇杨煜普
2篇王锡淮
2篇周铭

传媒

1篇计算机应用研...
1篇计算机科学

年份

1篇2024
1篇2023
3篇2022
2篇2021
1篇2020
3篇2013

共 11 条记录，以下是 1-10

全选清除导出

排序方式：

一种基于双向模型的强化学习方法: 一种基于双向模型的强化学习方法，用于机器人控制，其特征在于，包括：正向模型、反向模型、正向策略、反向策略，从某真实的状态开始，双向地生成轨迹，在三个阶段不断进行迭代：数据搜集阶段、模型学习阶段、策略优化阶段，直到算法收敛...; 张伟楠赖行沈键

基于滚动时间窗的动态协同过滤推荐模型及算法被引量：9: 2013年; 为了提高传统的协同过滤推荐系统的性能,首次提出了考虑时序性的基于滚动时间窗的用户-项目-时间三维动态模型,并在此基础上研究了针对该模型的协同过滤推荐算法。该模型算法对不同时间的兴趣评分按时间序列处理,用户兴趣相似度由不同时间段的分量组合而成,提高了算法的时效性;进而推导出了该模型的增量算法,利用增量算法减少了计算相似度的时间复杂度,从而提高了算法的扩展性;最后设计了合理的实验,实验结果表明提出的三维动态模型及算法在命中率性能上优于传统的二维协同过滤推荐模型及算法。; 沈键杨煜普; 关键词：协同过滤时间序列

一种基于自适应模型的机器人强化学习方法: 本发明提出了一种基于自适应模型的机器人强化学习方法，在正常学习一个环境模型的同时，加入模型自适应的步骤，从而可以达到提升虚拟数据准确性的效果。具体来说，当模型是一个神经网络结构，模型自适应通过减小真实数据和虚拟数据在网络...; 张伟楠沈键赵晗; 文献传递

基于二阶段相似度学习的协同过滤推荐算法被引量：8: 2013年; 针对传统的基于最近邻协同过滤推荐算法中计算相似度存在的缺陷,提出了一种基于二阶段相似度学习的协同过滤推荐算法,该算法旨在通过较少的迭代计算改善推荐算法性能。它以既约梯度法迭代寻优为主、最近邻算法为辅,通过邻居的海选和精选,最终提高了相似度的计算精度,改善了误差性能。实验表明,在一定条件下该算法不仅在误差性能上优于传统的推荐算法,而且其算法收敛速度快,可实现相似度参数动态调整和分布式计算。; 沈键杨煜普; 关键词：协同过滤 K-最近邻算法

一种基于模型强化学习的自动超参数调节方法: 本发明公开了一种基于模型强化学习的自动超参数调节方法，涉及强化学习方法领域。本发明提出将超参数的调节过程建模为一个新的马尔科夫决策过程，再使用强化学习的方法训练一个超参数控制器。该超参数控制器可以根据当前训练阶段的各种状...; 张伟楠赖行沈键

一种基于模型的多智能体强化学习方法: 本发明公开了一种基于模型的多智能体强化学习方法，属于多智能体强化学习领域，包括对多智能体环境和策略建模，生成多智能体的虚拟轨迹，利用虚拟轨迹更新多智能体的策略。本发明中各智能体分布式进行决策，分别对多智能体环境与对手智能...; 张伟楠王锡淮沈键周铭

一种基于双向模型的强化学习方法: 一种基于双向模型的强化学习方法，用于机器人控制，其特征在于，包括：正向模型、反向模型、正向策略、反向策略，从某真实的状态开始，双向地生成轨迹，在三个阶段不断进行迭代：数据搜集阶段、模型学习阶段、策略优化阶段，直到算法收敛...; 张伟楠赖行沈键

一种基于模型强化学习的自动超参数调节方法: 本发明公开了一种基于模型强化学习的自动超参数调节方法，涉及强化学习方法领域。本发明提出将超参数的调节过程建模为一个新的马尔科夫决策过程，再使用强化学习的方法训练一个超参数控制器。该超参数控制器可以根据当前训练阶段的各种状...; 张伟楠赖行沈键; 文献传递

一种基于自适应模型的机器人强化学习方法: 本发明提出了一种基于自适应模型的机器人强化学习方法，在正常学习一个环境模型的同时，加入模型自适应的步骤，从而可以达到提升虚拟数据准确性的效果。具体来说，当模型是一个神经网络结构，模型自适应通过减小真实数据和虚拟数据在网络...; 张伟楠沈键赵晗

电子商务的个性化协同过滤推荐算法研究: 协同过滤技术是推荐系统中应用最广泛的一种个性化推荐技术,因而得到了众多科研人员的青睐。本文以协同过滤推荐算法为主要研究对象,针对协同过滤推荐算法在实际应用中面临的准确性、扩展性、数据稀疏性和实时动态性等几个关键性问题进行...; 沈键; 关键词：电子商务协同过滤个性化推荐

全选清除导出

共2页<1 2>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张