彭太乐
- 作品数:27 被引量:91H指数:5
- 供职机构:淮北师范大学计算机科学与技术学院更多>>
- 发文基金:安徽省高校省级自然科学研究项目国家自然科学基金安徽省高等学校优秀青年人才基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信机械工程更多>>
- 基于时序上下文的视频场景分类被引量:2
- 2014年
- 以传统的词袋模型为基础,根据相邻镜头关键帧之间具有相关性的特点提出了一种用于视频场景分类的模型。将视频片段进行分割,提取关键帧,对关键帧图像归一化。将关键帧图像作为图像块以时序关系合成新图像,提取新图像的SIFT特征及HSV颜色特征,将图像的SIFT特征及HSV颜色特征数据映射到希尔伯特空间。通过多核学习,选取合适的核函数组对每个图像进行训练,得到分类模型。通过对多种视频进行实验,实验结果表明,该方法在视频场景分类中能取得很好的效果。
- 彭太乐张文俊丁友东郭桂芳
- 关键词:多核学习
- 图像型垃圾邮件过滤技术研究综述被引量:2
- 2011年
- 首先概述了图像型垃圾邮件的基本概念;其次根据不同的标准对图像型垃圾邮件过滤技术进行了分类,并评述了各种图像型垃圾邮件过滤方法和技术;对已经用于图像型垃圾邮件分类的两类共五种分类算法进行了理论分析与效果比较;最后对图像型垃圾邮件过滤技术的研究方向进行了展望。
- 宋文张明新彭太乐
- 关键词:图像型垃圾邮件
- 利用时空图方法进行车流量实时检测被引量:1
- 2015年
- 提出了一种新的时空图计算方法,并且利用时空图对车流量进行实时检测。该方法中,首先使用时空图将交通监控的视频转换成空间信息与时间信息都包含在内的连续图像,然后对时空图进行边缘提取、图像分割等处理,利用时空图上车辆的边缘、形状和占道率等信息,计算出一段时间内的车流量。本实验所用的视频由架在路边建筑物上的摄像机拍摄获得。实验结果表明,该方法能够实时、有效、准确地检测出一段时间内的交通车流量,并且能够对实时的路况进行监测,具有很好的实用价值。
- 张栋冰彭太乐
- 关键词:车流量
- 图像检索技术在喷涂件表面质量检测中的应用
- 2015年
- 针对生产线喷涂件表面喷涂质量检测问题,设计了基于多特征的图像检索系统,用来检测喷涂件表面喷涂效果.基于图像的SIFT特征、纹理、颜色直方图构建图像检索系统;通过CCD图像传感器获取样例图像作为查询样本,由在线获取的图像流构成图像库,定义相似度函数及阈值,在图像流中查找是否存在满足阈值的图像.通过仿真实验表明:该方法能较准确地检测出生产线中的残次产品,为喷涂产品表面质量检测提供一个新的思路.
- 彭太乐张文俊张震郭桂芳黄东晋
- 关键词:SIFT特征纹理颜色矩
- 基于内容的图像检索中若干问题的研究
- 基于内容的图像检索是一种利用图像的视觉特征(颜色、纹理、形状等)进行图像检索的技术。随着计算机科学和数据库技术的发展,CBIR己成为国内外的一个研究热点。
文中首先回顾了基于内容的图像检索理论及其应用研究的发展...
- 彭太乐
- 关键词:图像检索高层语义
- 文献传递
- 师范类数字电路课程建设研究
- 2003年
- 本文对高师院校《数字电路逻辑设计》课程的性质作了详细地分析,提出提高教学质量,从把握学科基础、培养学生的创新能力和利用计算机辅助教学三个方面入手,并对每一方面进行了研究.
- 彭太乐
- 关键词:数字电路计算机辅助教学
- 基于SURF的增强现实标识物跟踪注册被引量:5
- 2010年
- 针对基于标识物的增强现实跟踪注册方法对复杂环境的适应能力和鲁棒性的不足,提出一种用SURF实现标识物跟踪注册的改进算法。用SURF对平面标识物的特征点进行检测与描述,采用K-means算法对检测出的标识物特征点集合进行聚类分析得到其聚类中心,结合对视频图像中标识物的阈值分割与连通域分析,以聚类中心构建标识物的SURF特征点坐标系,通过矩阵变换实现标识物的跟踪注册。实验结果表明,该算法的增强现实系统具备较好的鲁棒性、稳定性和实时性。
- 沈克彭太乐
- 关键词:注册
- 基于增强现实的物联网物体识别与虚拟交互被引量:7
- 2010年
- 介绍增强现实的物联网物体识别与定位原理,分析基于数据手套的物联网增强现实虚拟交互方法,设计并实现一个物联网增强现实虚拟交互系统原型。实验结果表明,该系统能为物联网用户提供更自然的物体信息获取方式与虚拟交互体验,满足物联网相关应用对于实时性、精确度和稳定性的要求。
- 沈克彭太乐
- 关键词:物联网数据手套
- 基于提示方法与知识蒸馏方法的口语语音识别模型构建
- 2023年
- 提示方法是利用预训练语言模型的一种有效技术,只需要少量的示例就可以使用语言模型进行一个新的自然语言任务。文章提出了一种新的基于提示方法和知识蒸馏方法的语音识别模型(SpokenPrompt-KD模型)。该模型利用Wav2Vec模型将语音转化为预训练语言模型可识别的文本嵌入形式,从而将语言模型的小样本学习能力拓展到语音识别领域,同时通过知识蒸馏方法将教师语言模型中的知识传递给学生语音模型,以提高模型在语音理解任务上的准确性。实验结果表明,在100 h的数据集上进行预训练后,模型在分类任务上的准确率可以达到88.4%,证明了这种小样本学习能力的模型在语音识别领域是可行的、有效的。
- 郭嘉彭太乐
- 关键词:自然语言处理
- 基于互通道损失数据增强网络的细粒度图像分类被引量:1
- 2023年
- 寻找与细微特征对应的区别性局部区域是解决细粒度图像分类问题的关键。近年来,通过弱监督数据增强网络(WS-DAN)进行细粒度分类取得了优异的效果,但其单一的交叉熵损失(CE-Loss)使得网络专注于全局判别性区域,而遗漏了一些局部判别性区域。针对这一问题,提出基于互通道损失(MC-Loss)的数据增强网络(MC-DAN),互通道损失能强制属于同一类别的特征通道更具有区分性。其次,引入反事实注意力机制(CAL),通过反事实干预来鼓励网络学习更多的注意力信息。此外,提出一种空间注意力和通道注意力相结合的注意力模块,以更好地关注图像中的对象区域。在3个公共数据集上的综合实验表明,该方法能有效实现分类。
- 胡晓斌彭太乐