您的位置: 专家智库 > >

鲍翊平

作品数:11 被引量:22H指数:3
供职机构:国防科学技术大学信息系统与管理学院信息系统工程重点实验室更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术经济管理文化科学社会学更多>>

文献类型

  • 7篇期刊文章
  • 2篇学位论文
  • 2篇会议论文

领域

  • 9篇自动化与计算...
  • 2篇经济管理
  • 1篇社会学
  • 1篇文化科学

主题

  • 3篇对等网
  • 2篇多AGENT...
  • 2篇学习算法
  • 2篇强化学习方法
  • 2篇Q学习
  • 2篇多AGENT...
  • 1篇多AGENT...
  • 1篇多AGENT...
  • 1篇信任
  • 1篇信任管理
  • 1篇映射
  • 1篇元组
  • 1篇约定
  • 1篇社会
  • 1篇社会生态
  • 1篇社会生态系统
  • 1篇生态
  • 1篇强化学习算法
  • 1篇种群
  • 1篇协商

机构

  • 11篇国防科学技术...

作者

  • 11篇鲍翊平
  • 9篇姚莉
  • 4篇张维明
  • 4篇王长缨
  • 4篇尹晓虎
  • 2篇唐九阳
  • 1篇陈磊

传媒

  • 2篇计算机工程与...
  • 2篇计算机科学
  • 1篇模式识别与人...
  • 1篇小型微型计算...
  • 1篇科学技术与工...
  • 1篇中国人工智能...

年份

  • 2篇2011
  • 2篇2010
  • 1篇2009
  • 2篇2006
  • 2篇2005
  • 1篇2004
  • 1篇2003
11 条 记 录,以下是 1-10
排序方式:
对等网中基于种群进化的信誉模型被引量:2
2011年
信誉系统是应对对等网信任危机的关键途径。提出了一种新的基于种群进化的信誉模型。该模型将对等网视为社会生态系统,将节点的信誉评估过程模型化为一种进化过程,通过引入交叉和变异,节点能快速有效地评估潜在交易对象的信任度,从而最终提高其网络适应能力。通过仿真对模型进行了验证。
鲍翊平姚莉张维明唐九阳
关键词:对等网种群进化
一种共享经验元组的多agent协同强化学习算法被引量:6
2005年
Q学习算法是一种最受欢迎的模型无关强化学习算法。本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经验元组的多agent协同强化学习算法,其中采用一种新的状态行为的知识表示方法使得状态行为空间得到缩减,采用相似性变换和经验元组的共享使得学习的效率得到提高。最后将该算法应用于猎人捕物问题域。实验结果表明该算法能够加快多个猎人合作抓捕猎物的进程,有利于协作任务的成功执行,并能提高多agent协作团队的协作效率,因此该算法是有效的。
王长缨尹晓虎鲍翊平姚莉
关键词:多AGENT学习Q学习
一种基于本体映射处理推荐信任信息的模型被引量:3
2009年
在高动态、开放、异质和分布式网络环境下,在线实体不可避免地需要在交互之前考虑其潜在合作伙伴的可信程度。由于实体通常不具备关于这些潜在合作伙伴的足够知识,因此从所谓第三方收集一些推荐信任信息是必要而且重要的。然而,由于目前没有关于信任的一致理解,推荐信任信息很难被实体理解和使用。信任本体的出现有助于解决这个问题,从而促进互操作性。但在实际上,目前仍没有一个可被所有实体全局共享的信任本体。提出一个采用本体映射来促进推荐信任信息理解的模型,该模型实现了基于不同信任本体的各参与方的有效交互,提高了在线环境中信任管理的灵活性、开放性和可扩展性。
鲍翊平张维明姚莉
关键词:信任信任管理本体映射
基于目标分解的多Agent协作强化学习方法
本文将单agent Q学习引入到多agent环境,提出了一种多agent协作团队的Q学习方法,即基于承诺和约定先给agent分配求解子目标,然后针对系统求解过程中的相似性,用相似性来减少学习过程的状态空间,并利用Q值共享...
尹晓虎王长缨姚莉鲍翊平
文献传递
基于随机博弈的Agent协同强化学习方法被引量:6
2006年
本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。
王长缨尹晓虎鲍翊平姚莉
关键词:多AGENT系统
对等网中一种面向推荐行为的反馈可信度评估模型被引量:1
2010年
对等网信誉系统的一个关键问题就是信誉评估的准确性,一般通过考察推荐方的反馈可信度来给其反馈加权.提出一种新的反馈可信度评估模型,模型基于推荐方历史推荐行为满意度预测其未来的推荐行为,模型提出的"虚检验"机制加速了评估的过程,并且提高了准确性.仿真和分析表明,模型能有效抑制恶意推荐行为,降低其对最终信誉评估的影响.
鲍翊平姚莉张维明唐九阳
关键词:对等网
一种基于意图隐藏的对等网推荐可信度评价模型
2010年
对等网信誉系统的一个关键问题是如何提高推荐信息的可用性。现有模型将推荐节点的交易可信度等同于其推荐可信度,因而容易造成恶意推荐节点对信誉系统的虚假推荐和共谋推荐攻击。提出了一种基于意图隐藏的推荐可信度评价模型。在该模型中,一方面恶意推荐节点无法判断节点的查询意图,因而很难采取针对性行为;另一方面,基于历史推荐满意度的评价方法能对节点的推荐可信度进行有效评价。分析和仿真结果验证了模型的有效性。
鲍翊平姚莉张维明
关键词:对等网
P2P环境下演化的信誉系统及其关键技术研究
当前,P2P系统的安全和可用性问题已经成为制约P2P技术发展和应用的最大障碍之一,面对大量存在的恶意和自私行为,P2P的信任风险正急剧增大。信誉系统提供了一种有效的机制,它能够抑制节点的恶意行为,并激励节点积极参与交易,...
鲍翊平
关键词:集群
文献传递
基于AUML与GPN的Agent交互协议建模被引量:4
2006年
本文提出了一种基于AUML和CPN的Agent交互协议建模和检验的方法。该方法的主要思想是首先利用AUML协议图对Agent交互协议进行描述;然后在此基础上利用各种通信协议建模中常用的有色Petri网(CPN)来对交互协议进行描述,并进一步转换成为比较适合描述多个Agent并发交互的形式。此外,可以使用CPN的验证工具对CPN所描述的交互协议进行检验。
陈磊姚莉鲍翊平
关键词:AUMLCPNAGENT协商
一种多Agent协作的Q学习算法及其试验研究
1引言MAS(Multi-Agent Systems)是当前人工智能研究的热点,MAS的环境是复杂、大型、开放、动态和不可预测的,在设计时,难以预见agent可能遇到的所有潜在状态以及预先详细地优化agent的行为,无法...
鲍翊平姚莉王长缨尹晓虎
关键词:COOPERATIONQ-LEARNING
文献传递
共2页<12>
聚类工具0