王子磊
- 作品数:115 被引量:93H指数:6
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术电子电信环境科学与工程哲学宗教更多>>
- 图像语义分割网络持续学习方法、系统、设备及存储介质
- 本发明公开了一种图像语义分割网络持续学习方法、系统、设备及存储介质,通过在特征空间中使用对比学习对新增类别的类别知识进行挖掘,显著降低语义分割网络在后续学习阶段特征空间的优化难度,进而提升其对新类别的学习性能。而且,在输...
- 王子磊林子涵
- 面向多智能体同步博弈的建模方法及动作预测系统
- 本发明提供了面向多智能体同步博弈的建模方法及动作预测系统,所述建模方法包括:获取同步博弈问题的状态集与动作集;根据所述同步博弈问题的特性,设计博弈特征与特征编码方法;根据所述博弈特征与特征编码方法,对所述状态集与动作集进...
- 王子磊陈鹏李厚强
- 文献传递
- 特征互斥化的目标检测域适应方法
- 2024年
- 当前,蒸馏学习已成为目标检测无监督域适应领域中的一种常用技术手段。然而蒸馏带来的特征偏移会导致目标域上伪标签的准确性较低,不利于目标域的精确检测。因此提出特征互斥化方法,包括特征分布互斥化和特征属性互斥化。其中特征分布互斥化鼓励网络对不同类别的特征分布进行互斥,特征属性互斥化促使分类器对不同类别主要使用的属性进行互斥。还提出强弱增强一致性方法对网络的预测输出进行一致性约束,促使网络提取的特征中主要包含与目标域检测相关的属性,进一步提高特征互斥化方法的效果。所提方法在多个域适应场景上进行了广泛的实验,在相同实验设置下的结果表明,所提方法较其他先进方法具有更好的有效性。
- 李润泽王子磊
- 关键词:目标检测计算机视觉
- 视频资源流行度预测方法
- 本发明公开了一种视频资源流行度预测方法,包括:统计一定区域内群体用户的收视数据,获得群体用户的收视类型数据和交互行为数据,并利用收视类型数据来计算所统计数据的资源流行度;利用耦合用户行为的LDA模型,遍历收视类型数据和交...
- 王子磊朱策
- 文献传递
- 基于互联网的电视流媒体数据实时传输和服务装置及方法
- 基于互联网的电视流媒体数据实时传输和服务装置及方法在互联网中,利用转码服务器,将直接接收的电视媒体数据进行实时转码,然后向各个小区媒体服务器分发转码后的多媒体数据,再由小区媒体服务器对数据进行存储,同时向用户提供电视媒体...
- 李俊王子磊盛延敏李靖许书彬殷保群
- 文献传递
- 基于OpenFlow的流媒体云服务迁移方法被引量:3
- 2014年
- 传统基于应用层中间件或代理的服务迁移技术容易造成单点故障且扩展性差,并且流媒体的交互性和长会话特性使其难以实现对用户透明。为此,提出一种基于Open Flow的流媒体云服务迁移方法。通过在网络层进行流媒体云迁移实现对用户的服务透明,同时针对网络层的服务迁移代价问题,提出一种基于用户请求预测的迁移策略,在提升系统容量的同时优化服务迁移数。实验结果表明,该迁移策略可有效地提高服务请求接受率,进而增强系统服务能力。
- 战立松奚宏生王子磊
- 关键词:流媒体云计算
- 基于状态特征和后继特征的特征与策略的联合学习方法
- 本发明公开了一种状态特征和后继特征的联合策略学习方法,包括:通过学习从输入状态到即时奖励的映射,获得表征输入状态的状态特征;通过学习从状态特征到价值评估函数的映射,获得后继特征;获得的状态特征与后继特征处于不同的时间分辨...
- 查正军李厚强冯晓云李斌王子磊
- 文献传递
- 组合式零样本图像分类方法、系统、设备及存储介质
- 本发明公开了一种组合式零样本图像分类方法、系统、设备及存储介质,它们是对应的方案,方案中:构建基于子类信息感知的特征提取网络与基于子类信息调制的动态分类器,基于子类信息感知的特征提取网络能够捕捉表征图像子类信息的视觉特征...
- 王子磊胡效鸣
- 一种多阶段视频动作检测方法
- 本发明公开了一种多阶段视频动作检测方法,包括:对于输入的未剪切视频通过基于深度残差网络的二分类与投票融合策略,生成融合多尺度采样与单尺度训练的粗动作片段;对于粗动作片段,基于帧级动作识别结果,采用统计融合策略进行动作类别...
- 王子磊赵琰
- 文献传递
- 建模交互关系和类别依赖的视频动作检测
- 2023年
- 目的视频动作检测旨在检测出视频中所有人员的空间位置,并确定其对应的动作类别。现实场景中的视频动作检测主要面临两大问题,一是不同动作执行者之间可能存在交互作用,仅根据本身的区域特征进行动作识别是不准确的;二是一个动作执行者在同一时刻可能有多个动作标签,单独预测每个动作类忽视了它们的内在关联。为此,本文提出了一种建模交互关系和类别依赖的视频动作检测方法。方法首先,特征提取部分提取出关键帧中每个动作执行者的区域特征;然后,长短期交互部分设计短期交互模块(short-term interaction module,STIM)和长期交互模块(long-term interaction module,LTIM),分别建模动作执行者之间的短期时空交互和长期时序依赖,特别地,基于空间维度和时间维度的异质性,STIM采用解耦机制针对性地处理空间交互和短期时间交互;最后,为了解决多标签问题,分类器部分设计类别关系模块(class relationship module,CRM)计算类别之间的依赖关系以增强表征,并利用不同模块对分数预测结果的互补性,提出一种双阶段分数融合(two-stage score fusion,TSSF)策略更新最终的概率得分。结果在公开数据集AVA v2.1(atomic visual actions version 2.1)上进行定量和定性分析。定量分析中,以阈值取0.5时的平均精度均值mAP@IoU 0.5(mean average precision@intersection over union 0.5)作为主要评价指标,本文方法在所有测试子类、Human Pose大类、Human-Object Interaction大类和Human-Human Interaction大类上的结果分别为31.0%,50.8%,22.3%,32.5%。与基准模型相比,分别提高了2.8%,2.0%,2.6%,3.6%。与其他主流算法相比,在所有子类上的指标相较于次好算法提高了0.8%;定性分析中,可视化结果一方面表明了本文模型能精准捕捉动作执行者之间的交互关系,另一方面体现了本文在类别依赖建模上的合理性和可靠性。此外,消融实验证明了各个模�
- 贺楚景刘钦颖王子磊