明悦
- 作品数:87 被引量:32H指数:3
- 供职机构:北京邮电大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信机械工程更多>>
- 汉语语音识别网站的设计与实现
- 随着网络技术的飞速发展,它为汉语研究领域带来了新的动力。本文设计并实现了一种汉语语音识别的网站。介绍了隐含马尔科夫模型(HMM)在语音识别系统中的应用和小波变换在声调识别中的应用。采用JSP 和SQL Server 20...
- 明悦苗振江
- 关键词:语音识别小波变换系统开发网站设计
- 文献传递
- 一种基于鲁棒性表征学习的场景文本识别方法
- 本发明提供了一种基于鲁棒性表征学习的场景文本识别方法。该方法包括:将待识别的图像输入文本矫正网络,得到矫正图像;将矫正图像输入编码器,编码器利用坐标编码模块提取图像的空间纹理信息,利用上下文建模网络提取文本的语义建模特征...
- 明悦范春晓孙娟娟邓冠玉邓茜
- 文献传递
- 一种基于注意力的抗遮挡多目标跟踪方法
- 本发明提供了一种基于注意力的抗遮挡多目标跟踪方法。该方法包括:主干网络获得该第t帧图片中检测目标的特征;根据遮挡情况将第t帧图片中检测目标的特征划分为独立跟踪目标特征和非独立跟踪目标特征,将非独立跟踪目标特征划分为跟踪目...
- 明悦杨铭吕柏阳胡楠楠
- 一种基于胶囊网络的半自回归图像描述方法
- 本发明提供了一种基于胶囊网络的半自回归图像描述方法。该方法包括:提取图像特征,将提取的图像特征输入到Transformer编码器中进行处理得到视觉上下文特征;将所述视觉上下文特征和语言特征输入到Transformer解码...
- 明悦胡楠楠范春晓吕柏阳
- 一种快速结算方法和装置
- 本发明实施例提供一种快速结算方法和装置,涉及计算机技术和图像识别领域,能够提高结算的效率。该方法包括:首先获取餐具的颜色和形状特征信息,并将该特征信息与特征库中的特征信息进行比对,若比对成功则生成并显示与该特征信息对应的...
- 明悦范春晓王光超杨晓楠李扬
- 文献传递
- 改进的核相关滤波器目标跟踪算法被引量:24
- 2015年
- 针对传统单目标的核相关滤波器(KCF)跟踪算法在目标尺度变化的跟踪中存在的问题,提出了一种基于相关滤波器(CF)和尺度金字塔的多尺度核相关滤波器(SKCF)跟踪算法。首先通过传统KCF跟踪算法中分类器的响应计算当前目标是否受到遮挡,在未受到遮挡的情况下,对当前目标建立尺度金字塔;然后通过相关滤波器求取尺度金字塔的最大响应得到当前目标尺度信息;最后使用新目标图像为训练样本更新目标的外观模型和尺度模型。与核化的结构化输出(Struck)算法、KCF算法、跟踪-学习-检测(TLD)算法和多示例学习(MIL)算法进行对比,实验结果表明,所提出的多尺度核相关滤波器(SKCF)跟踪算法在五种算法中精确度和重合度都取到最高值。所提算法能够广泛应用于目标跟踪领域,对目标进行准确的跟踪。
- 余礼杨范春晓明悦
- 关键词:目标跟踪多尺度相关滤波器遮挡检测
- 语音识别与评测在汉语学习中的应用
- 近些年来,随着中国经济的快速发展和国际地位的不断提高,中国与世界的交往和联系日趋广泛和深入。汉语作为世界各国了解中国的重要工具和中华文化的主要载体,不少国家出现了学习汉语的热潮。而计算机辅助语言教学(Computer-A...
- 明悦
- 关键词:语音识别汉语学习计算机辅助语言教学
- 文献传递
- 对齐特征表示的跨模态人脸识别被引量:4
- 2020年
- 跨模态人脸识别一直是人脸识别领域的研究热点,在安防、刑侦等现实场景中具有极高的应用价值和发展潜力。现有的跨模态人脸识别算法通常在图像空间或潜在空间建立不同模态人脸的联系,却忽略了二者的内在关联性,容易导致跨模态信息的丢失。为解决这一问题,本文提出基于对齐特征表示的跨模态人脸识别算法(Cross-Domain Representation Alignment,CDRA)。CDRA算法在人脸图像空间和潜在空间、模态内和模态间探索不同模态人脸数据间的关联性首先,为减少信息损失,CDRA算法通过对单一模态内人脸的重建,学习到包含判别信息的模态内潜在特征表示;然后,在图像空间,CDRA算法通过从不同模态的潜在特征表示中,跨模态地重建图像,以间接对齐不同模态的潜在特征表示,在潜在空间,CDRA算法通过对齐不同模态数据的潜在高斯分布直接对齐不同模态的潜在特征表示,促使特征表示学习到不同模态人脸在不同空间维度多个层次的跨模态信息。实验结果表明CDRA算法在Multi-Pie数据集上的人脸识别准确率的平均值为97.2%,在CASIA NIR-VIS 2.0数据集上的人脸识别准确率为99.4%±0.2%,同时实现了跨模态人脸数据的高效互生成。CDRA算法能够在图像空间和潜在子空间学习到更具判别能力的跨模态关联信息,有效地提高了跨模态人脸识别准确率。
- 明悦王绍颖范春晓周江婉
- 关键词:人脸合成
- 一种基于一致片段选择的视听事件定位方法
- 本发明提供了一种基于一致片段选择的视听事件定位方法。该方法包括:从待进行识别的视听事件的视频流中提取初步的视觉特征和听觉特征;将初步的视觉特征和听觉特征通过双向引导的共同注意力,得到增强后的视觉特征和听觉特征;从增强后的...
- 明悦冯帆周江琬吕柏阳刘元安
- 三维人脸识别方法和系统
- 本发明提供了一种三维人脸识别方法和系统。所述方法包括:通过三维面部参考模型对输入的双目视觉图像对进行姿态估计,以得到姿态参数和三维面部参考模型相对所述双目视觉图像对的虚拟图像对;以所述虚拟图像对为先验信息重建所述双目视觉...
- 明悦蒋杰刘婷婷王巨宏
- 文献传递