北京大学信息工程学院 作品数:137 被引量:267 H指数:7 相关作者: 赵勇 王嘉炜 王文敏 王荣刚 刘威杨 更多>> 相关机构: 贵州大学计算机科学与技术学院 广西民族大学管理学院 哈尔滨工业大学深圳研究生院 更多>> 发文基金: 国家自然科学基金 深圳市科技计划项目 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 经济管理 自然科学总论 更多>>
基于VSPTIDR编码压缩的测试资源划分方法 2008年 提出了一种有效的新型测试数据压缩编码——VSPTIDR编码,该编码方法只需对编码字进行移位操作即可得到相应的游程长度,在测试集中0的概率p满足p≥0.92时,能取得比FDR编码更高的压缩率。该编码方法的解码器也较FDR编码的解码器简单、易实现且能有效节省硬件开销。这一系列改进降低了芯片的测试和制造成本,从而也就降低了芯片的整体成本。 左仁福 崔小乐 李国亮 张兴关键词:测试数据压缩 解码器 内嵌微流道低温共烧陶瓷基板传热性能(英文) 被引量:2 2016年 随着系统级封装(SIP)所容纳的电子元器件和集成密度迅速增加,传统的散热方法(热通孔、风冷散热等)越来越难以满足系统级封装的热管理需求。低温共烧陶瓷(LTCC)作为常见的封装基板材料之一,设计并研制了三种内嵌于LTCC基板的微流道,其中包括直排型、蛇型和螺旋型微流道(高度为0.3mm,宽度分别为0.4,0.5和0.8mm)。通过数值仿真和红外热像仪测试相结合的方式分析了微流道网络结构、流体质量流量、雷诺数、材料热导率对内嵌微流道LTCC基板换热性能的影响,实验结果表明:当去离子水的流量为10mL/min,热源等效功率为2 W/cm^2时,直排型微流道的LTCC基板最高温度在3.1kPa输入泵压差下能降低75.4℃,蛇型微流道的LTCC基板最高温度在85.8kPa输入泵压差下能降低80.2℃,螺旋型微流道的LTCC基板最高温度在103.1kPa输入泵压差下能降低86.7℃。在三种微流道中,直排型微流道具有最小的雷诺数,在相同的输入泵压差下有最好的散热性能。窄的直排型微流道(0.4 mm)在相同的流道排布密度和流体流量时比宽的微流道(0.8mm)能多降低基板温度10℃。此外,提高封装材料的热导率有助于提高微流道的换热性能。 胡独巍 缪旻 方孺牛 崔小乐 金玉丰关键词:低温共烧陶瓷 传热性能 强制对流换热 一种基于分块压缩感知的鲁棒图像散列算法 被引量:1 2016年 图像散列算法是一种把数字图像映射为一个基于内容的简短二进制比特串的技术,它具有鲁棒性、安全性、紧凑性和单向性等特点,已被广泛应用于图像鉴别与图像识别领域中。本文提出一种基于分块压缩感知的鲁棒图像散列算法,其设计利用了压缩感知采样阶段的计算保密及线性运算的特点。该算法通过对图像进行分块,利用压缩感知理论在密钥的控制下将图像块随机投影为一个测量值向量序列,并把每个测量值向量量化为一个比特,得到一个长度可由分块策略调整的二进制散列值。实验结果表明,本文算法在鲁棒性、安全性和运算速度等方面具有良好的性能。 朱跃生 莫志威 孙自强关键词:图像鉴别 电视背景环境下语音命令识别系统 设计了一种电视背景环境下的非特定人语音控制命令识别系统,包括基于隐马尔可夫模型的孤立词识别子系统和基于扩展信息最大化(Infomax)独立成分分析算法的语音分离子系统。本语音识别系统的语音库包括8 400个电视机转台控制... 范婷 刘宏关键词:隐马尔可夫模型 基于MDT特征补偿的噪声鲁棒语音识别算法 被引量:2 2013年 针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。 胡旭琰 邹月娴 王文敏关键词:语音识别 一种用于LCD驱动的低功耗缓冲放大器 被引量:2 2007年 设计了一种用于LCD驱动的低功耗CMOS缓冲放大器。该放大器采用了共源共栅的频率补偿方法,并结合阻尼因子控制技术,能够驱动大动态范围的容性负载,以较低的功耗达到了LCD驱动的速度要求。在0.35μm CMOS工艺模型下,该缓冲放大器的静态功耗为60μW。 蒋延飞 林丰成 张兴关键词:CMOS LCD驱动 缓冲放大器 低功耗 基于CLIP生成多事件表示的视频文本检索方法 2023年 视频-文本检索作为一项被广泛应用于现实生活中的多模态检索技术受到越来越多的研究者的关注.近来,大部分视频文本工作通过利用大规模预训练模型中所学到的视觉与语言之间的匹配关系来提升文本视频间跨模态检索效果.然而,这些方法忽略了视频、文本数据都是由一个个事件组合而成.倘若能捕捉视频事件与文本事件之间的细粒度相似性关系,将能帮助模型计算出更准确的文本与视频之间的语义相似性关系,进而提升文本视频间跨模态检索效果.因此,提出了一种基于CLIP生成多事件表示的视频文本检索方法(CLIP based multi-event representation generation for video-text retrieval,CLIPMERG).首先,通过利用大规模图文预训练模型CLIP的视频编码器(ViT)以及文本编码器(Tansformer)分别将视频、文本数据转换成视频帧token序列以及文本的单词token序列;然后,通过视频事件生成器(文本事件生成器)将视频帧token序列(单词token序列)转换成k个视频事件表示(k个文本事件表示);最后,通过挖掘视频事件表示与文本事件表示之间的细粒度关系以定义视频、文本间的语义相似性关系.在3个常用的公开视频文本检索数据集MSR-VTT,DiDeMo,LSMDC上的实验结果表明所提的CLIPMERG优于现有的视频文本检索方法. 涂荣成 毛先领 孔伟杰 蔡成飞 赵文哲 王红法 黄河燕DR-CNN:一种用于地铁列车故障检修的残差卷积神经网络模型 地铁运营部每天都要对列车进行详细的检修,并制定了规范的检修流程来保障地铁列车安全运行.但却因人工巡检,很难精准监督,容易造成各种漏检,带来了安全隐患.随着深度学习的突破,人工智能技术在很多特定的领域超越人类.尤其是在计算... 徐文博 左羽 赵勇 崔忠伟关键词:地铁列车 图像识别 基于RFID智能感知摄像机的溯源系统 被引量:2 2019年 近年来,食品安全案件屡有发生,亟需采用透明、安全、可信的食品安全溯源系统。然而现有的溯源系统高额的视频监测储存和传输费用,限制了溯源平台的推广。设计基于RFID具备联动功能的智能感知摄像机,采用自修复机制改进基于RFID的LANDMARC定位算法,精准定位每一只牲畜的活动区域;利用联动摄像头定量采集牲畜活动信息,建立牲畜活动信息;通过GPRS将采集的照片上传到服务器,极大降低视频存储和传输成本。同时将摄像头的功耗降到最低,使其能在野外用太阳能板为系统供电。用户可以通过扫描二维码查询牲畜档案信息,极大降低绿色健康畜产品溯源成本,推动溯源系统的广泛应用。 桑海伟 赵勇关键词:RFID 一种面向UI手稿识别的数据集制作方法 被引量:1 2022年 UI手稿识别是图像目标检测技术在软件工程领域的重要应用。由于UI手稿图像与自然图像有着较大的差异,而且主要依靠人工绘制,所以制作用于深度学习模型训练的UI手稿数据集往往比较困难,耗费大量人力。针对此问题,通过对UI手稿数据集的制作流程进行优化改进,提出了一种UI手稿数据集快速制作方法UIsketcher。在UIsketcher方法中,用户只需要完成一些基础UI组件的绘制,不需要任何框选标注,即可自动生成用于深度学习模型训练的数据集。与传统方法进行对比实验,结果表明:用户只需要绘制相对于传统方法25%的组件数量,即可得到相似的训练效果;若绘制传统方法75%的组件数量,训练效果将更好,可达到比传统方法更高的准确率。 杨起 刘牧耕 马郓关键词:目标检测 数据集