叶朝阳
- 作品数:3 被引量:30H指数:3
- 供职机构:浙江大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金浙江省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于视听分层模型的实时爆炸场景识别被引量:5
- 2004年
- 提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法 首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来 ,然后再分别用几个精细支持向量机把爆炸和类似爆炸的音频区分开 ,由此得到音频爆炸备选场景 由于大多数爆炸场景均伴随剧烈的视觉突变 ,因此对得到的音频爆炸备选场景再判断其对应的视觉特征是否发生了变化 。
- 庄越挺傅正钢叶朝阳吴飞
- 关键词:听觉视觉压缩域
- 鲁棒的镜头边缘检测融合算法被引量:15
- 2003年
- 对于镜头骤变检测 ,通过最小扩展树算法 (MST)提取保留了视频帧空间信息的颜色聚合向量直方图、引入了动态自适应阈值和时间阻尼 ,使得骤变检测效率高 ;对于渐变检测 ,通过分析其数学产生模型 ,根据模型特性实现渐变镜头检测 ;最后 。
- 叶朝阳吴飞庄越挺陈家实
- 关键词:视频图像序列视频流鲁棒性图像识别
- 大视场视频全景图生成研究被引量:10
- 2006年
- 针对采用传统方法生成的视频全景图存在拼接裂缝和“鬼影”现象的问题,提出了一种新的大视场视频全景图生成算法.该算法基于快速傅立叶变换的图像配准算法,求取两相邻视频帧之间的配准系数,采用改进的线性系统法对配准系数进行全局优化.对存在运动物体的视频图像,采用启发式最优路径搜索算法寻找到图像间拼接的最佳缝合线,并使用多分辨率原理进行图像拼接后的平滑处理.实验结果表明,该算法优化了图像间的配准系数,平滑处理了拼接后的图像,减少了人工性缺陷,提高了视频全景图的真实感.
- 吴飞肖鸿开赵勇庄越挺叶朝阳
- 关键词:全局优化