您的位置: 专家智库 > >

陈兴国

作品数:63 被引量:92H指数:4
供职机构:南京邮电大学更多>>
发文基金:国家自然科学基金江苏省自然科学基金创新研究群体科学基金更多>>
相关领域:自动化与计算机技术文化科学经济管理理学更多>>

文献类型

  • 43篇专利
  • 18篇期刊文章
  • 1篇学位论文
  • 1篇科技成果

领域

  • 32篇自动化与计算...
  • 7篇文化科学
  • 2篇经济管理
  • 1篇电子电信
  • 1篇理学

主题

  • 7篇智能体
  • 7篇环境模型
  • 6篇学习算法
  • 6篇用户
  • 6篇最小化
  • 6篇网络
  • 5篇强化学习算法
  • 5篇感器
  • 5篇传感
  • 5篇传感器
  • 3篇游戏
  • 3篇值函数
  • 3篇神经网
  • 3篇神经网络
  • 3篇水质
  • 3篇自动化
  • 3篇自动化控制
  • 3篇最优控制
  • 3篇作弊
  • 3篇协方差

机构

  • 58篇南京邮电大学
  • 14篇南京大学
  • 2篇江苏省地方税...
  • 1篇南京航空航天...
  • 1篇南京理工大学
  • 1篇杭州电子科技...
  • 1篇清华大学
  • 1篇淮阴工学院
  • 1篇计算机软件新...

作者

  • 63篇陈兴国
  • 9篇程春玲
  • 6篇高阳
  • 5篇黄海平
  • 5篇朱洁
  • 4篇戴华
  • 4篇王鹏
  • 4篇李扬
  • 4篇徐宁
  • 4篇李琦
  • 3篇余瀚
  • 3篇杨光
  • 2篇陈琳
  • 2篇刘威
  • 2篇张鹏
  • 2篇王皓
  • 2篇高阳
  • 2篇谢毅
  • 2篇王家良
  • 2篇陈蕾

传媒

  • 2篇自动化学报
  • 2篇模式识别与人...
  • 2篇计算机科学与...
  • 1篇计算机光盘软...
  • 1篇电子学报
  • 1篇南京大学学报...
  • 1篇计算机学报
  • 1篇现代计算机
  • 1篇软件学报
  • 1篇计算机科学
  • 1篇现代计算机(...
  • 1篇山东大学学报...
  • 1篇软件导刊
  • 1篇计算机教育
  • 1篇科教导刊(电...

年份

  • 8篇2024
  • 19篇2023
  • 4篇2022
  • 4篇2021
  • 3篇2020
  • 2篇2019
  • 7篇2018
  • 6篇2017
  • 2篇2016
  • 2篇2015
  • 3篇2014
  • 1篇2013
  • 2篇2008
63 条 记 录,以下是 1-10
排序方式:
一种形态滤波方法及装置
本发明公开了一种形态滤波方法,属于模式识别技术领域。本发明针对现有形态滤波算法结构固定、需预设结构元素和偏倚校正系数等不足,对其进行了改进,利用多层滤波形式,每层根据前后滤波的差值选取较优结构元素,并根据前后滤波信号的相...
程春玲王家良高阳陈兴国
文献传递
基于强化学习的多用户水产养殖自动调控系统及方法
本发明提出了一种基于强化学习的多用户水产养殖自动调控系统,主要由控制终端、数据终端和云平台三个模块,控制终端用于采集水体数据和大气环境数据,并将采集的数据传送至数据终端,同时能够操控自动控制模块调整水产环境;数据终端用于...
陈兴国陈康扬吴浩宇陈蕾
文献传递
社交网络中基于用户兴趣的登录认证方法
本发明公开了社交网络中基于用户兴趣的登录认证方法,首先选定具体的基于Web的社交网络应用场景,可以是电脑桌面终端也可以是智能移动终端,用户完成注册;将用户信息分为较稳定信息和不稳定信息两类,构建用户的信息模型。较稳定信息...
黄海平王鹏祁凌涛徐宁程春玲李琦陈兴国戴华
基于效用函数的期望最大搜索算法
2023年
强化学习已在各行业得到广泛应用,强化学习所需的大量探索在很多语境下均可能带来严重后果。为此,业界提出安全强化学习。从经济学中借鉴的效用函数是其中的一种常用技巧,但其在搜索算法中还未得到充分研究。当智能体在风险中立的语境下进行训练后,如何利用搜索算法将其迁移至风险敏感语境中仍是一个需要解决的问题。因此,提出向期望最大搜索算法中加入安全强化学习常用的效用函数技巧进行改进。以2048游戏为例,基于2022年最新的NTuple方法及在风险中立语境下所训练的权重,实验了不同的超参数。实验结果表明,将sigmoid函数作为效用函数应用于搜索算法中,可以显著提升算法性能。其中,在2层搜索中,改进后的算法相较于原始算法提升了14053.35分,在3层搜索中,提升了6522.9分。
魏语轩李昕闻陈兴国
关键词:效用函数
面向复杂交互场景的新型机器学习技术
高阳史颖欢霍静杨琬琪王皓陈兴国胡裕
机器学习是模式识别、机器视觉、数据挖掘等方向的支撑技术之一,被广泛应用到安防、医疗、大数据分析等领域。基于样本的独立同分布假设,监督学习技术通过学习已标记数据来训练模型。然而在复杂交互场景下,当处理动态、多源、弱标记等非...
关键词:
边缘计算中协作计算卸载与动态任务调度被引量:3
2023年
在边缘计算场景中,通过将部分待执行任务卸载到边缘服务器执行能够达到降低移动设备的负载、提升移动应用性能和减少设备开销的目的.对于时延敏感任务,只有在截止期限内完成才具有实际意义.但是边缘服务器的资源往往有限,当同时接收来自多个设备的数据传输及处理任务时,可能造成任务长时间的排队等待,导致部分任务因超时而执行失败,因此无法兼顾多个设备的性能目标.鉴于此,在计算卸载的基础上优化边缘服务器端的任务调度顺序.一方面,将时延感知的任务调度建模为一个长期优化问题,并使用基于组合多臂赌博机的在线学习方法动态调整服务器的调度顺序.另一方面,由于不同的任务执行顺序会改变任务卸载性能提升程度,因而影响任务卸载决策的有效性.为了增加卸载策略的鲁棒性,采用了带有扰动回报的深度Q学习方法决定任务执行位置.仿真算例证明了该策略可在平衡多个用户目标的同时减少系统的整体开销.
张斐斐葛季栋李忠金黄子峰张胜张胜陈兴国
关键词:任务调度
强化学习及其在电脑围棋中的应用被引量:32
2016年
强化学习是一类特殊的机器学习,通过与所在环境的自主交互来学习决策策略,使得策略收到的长期累积奖赏最大.最近,在围棋和电子游戏等领域,强化学习被成功用于取得人类水平的操作能力,受到了广泛关注.本文将对强化学习进行简要介绍,重点介绍基于函数近似的强化学习方法,以及在围棋等领域中的应用.
陈兴国俞扬
关键词:核方法神经网络
一种基于NFC技术的卡牌游戏防作弊系统及方法
本发明提出了一种基于NFC技术的卡牌游戏防作弊系统,该系统包括带有NFC标签的卡牌系统、NFC读写器系统、服务器和游戏比赛系统,所述带有NFC标签的卡牌系统中每张卡牌存储的ID编码信息均不相同并且独一无二;所述NFC读写...
陈兴国陈琳吴多丰杨尚东余瀚
基于知识图谱的菌株培养基成分预测方法及系统
本发明提供了一种基于知识图谱的菌株培养基成分预测方法及系统,所述基于知识图谱的菌株培养基成分预测方法旨在通过知识图谱构建技术、知识图谱图数据库、知识图谱嵌入式算法,将菌株数据包括基因组数据、培养基及其成分数据、菌株代谢关...
陈兴国蒋新成
一种结合Tile Coding的平均奖赏强化学习算法
2008年
平均奖赏强化学习是强化学习中的一类重要的非折扣最优性框架,目前大多工作都主要是在离散域进行.本文尝试将平均奖赏强化学习算法和函数估计结合来解决连续状态空间的问题,并根据状态域的改变,相应修改 R-learning 和 G-learning 中参数的更新条件.此外对结合函数估计的 G-learning 算法的性能表现及其对各种参数的敏感程度进行针对性研究.最后给出实验结果及分析.实验结果证明 R-learning 和 G-learning 在ε较小的情况下解容易发散,同时也说明特征抽取方法 Tile coding 的有效性,且可作为其它特征抽取方法的参考标准.
王巍巍陈兴国高阳
关键词:平均奖赏
共7页<1234567>
聚类工具0