您的位置: 专家智库 > >

国家教育部博士点基金(20010335049)

作品数:28 被引量:361H指数:13
相关作者:庄越挺吴飞潘云鹤刘骏伟刘丰更多>>
相关机构:浙江大学杭州师范大学浙江大学医学院附属邵逸夫医院更多>>
发文基金:国家教育部博士点基金国家自然科学基金浙江省自然科学基金更多>>
相关领域:自动化与计算机技术电子电信一般工业技术更多>>

文献类型

  • 28篇期刊文章
  • 1篇会议论文

领域

  • 27篇自动化与计算...
  • 5篇电子电信
  • 2篇一般工业技术

主题

  • 8篇支持向量
  • 8篇支持向量机
  • 8篇向量
  • 8篇向量机
  • 6篇视频
  • 5篇动画
  • 5篇图像
  • 4篇计算机
  • 3篇音频
  • 3篇运动捕获
  • 3篇人脸
  • 3篇金字塔
  • 3篇聚类
  • 3篇计算机动画
  • 3篇捕获
  • 2篇独立分量分析
  • 2篇多媒体
  • 2篇信号
  • 2篇语音
  • 2篇图像检索

机构

  • 29篇浙江大学
  • 3篇杭州师范大学
  • 1篇福州大学
  • 1篇浙江大学城市...
  • 1篇浙江大学医学...

作者

  • 26篇庄越挺
  • 20篇吴飞
  • 11篇潘云鹤
  • 6篇刘骏伟
  • 4篇刘丰
  • 4篇苏从勇
  • 3篇黄丽
  • 3篇赵雪雁
  • 3篇潘红
  • 3篇罗忠祥
  • 2篇张引
  • 2篇毛祎
  • 2篇余春艳
  • 2篇吴明晖
  • 2篇叶朝阳
  • 1篇古红英
  • 1篇肖俊
  • 1篇陈家实
  • 1篇吴海虹
  • 1篇吴聪苗

传媒

  • 14篇计算机辅助设...
  • 6篇计算机研究与...
  • 3篇中国图象图形...
  • 2篇中国机械工程
  • 2篇浙江大学学报...
  • 1篇机械工程学报
  • 1篇全国第13届...

年份

  • 1篇2006
  • 5篇2005
  • 9篇2004
  • 12篇2003
  • 2篇2002
28 条 记 录,以下是 1-10
排序方式:
基于贝叶斯网络增强预测模型的人脸多特征跟踪被引量:2
2005年
人脸多特征跟踪是当前计算机视觉中的一个难题,其中一个难点是需要尽可能准确地预测出下一帧中人脸多个特征轮廓的位置。提出了一个基于多重提示预测模型的跟踪算法,将基于二阶自回归过程的动力学模型的快速性特点与基于图模型(贝叶斯网络)动力学模型的准确性特点结合起来,得到融合的预测结果。多重提示的预测模型与观测模型可以方便地集成在卡尔曼滤波框架中。实验结果表明本文算法可以较准确地同时跟踪具有丰富表情的人脸多个特征。
苏从勇庄越挺黄丽吴飞
关键词:人脸贝叶斯网络计算机视觉快速性
基于模糊聚类表征的音频例子检索及相关反馈被引量:19
2003年
避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,直接从原始音频流中提取压缩域特征,使用时空约束机制进行压缩域特征的模糊聚类,用聚类结果的质心来表征整个音频例子,基于聚类质心完成相似度匹配,实现基于非监督机制的音频例子快速检索.并在检索过程中引入相关反馈,根据用户对检索结果的相关反馈调整检索结果,使其与用户的感官相似一致.实验结果表明,此种方法可以达到快速检索的效果,检索准确率可达85%以上.
赵雪雁吴飞庄越挺刘骏伟
关键词:音频检索模糊聚类语音信号处理
基于支持向量机的视频字幕自动定位与提取被引量:67
2002年
视频字幕蕴含了丰富语义 ,可用于对相应视频流进行高级语义标注 .文中首先将原始图像帧分割为 N× N的子块 ,提取每个子块的灰度特征 ;然后使用预先训练好的 SVM分类机进行字幕子块和非字幕子块的分类 ;最后结合金字塔模型和后期处理过程 ,实现视频图像字幕区域的自动定位提取 .
庄越挺刘骏伟吴飞潘云鹤张引
关键词:支持向量机视频字幕金字塔模型视频处理
基于视听分层模型的实时爆炸场景识别被引量:5
2004年
提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法 首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来 ,然后再分别用几个精细支持向量机把爆炸和类似爆炸的音频区分开 ,由此得到音频爆炸备选场景 由于大多数爆炸场景均伴随剧烈的视觉突变 ,因此对得到的音频爆炸备选场景再判断其对应的视觉特征是否发生了变化 。
庄越挺傅正钢叶朝阳吴飞
关键词:听觉视觉压缩域
鲁棒的镜头边缘检测融合算法被引量:15
2003年
对于镜头骤变检测 ,通过最小扩展树算法 (MST)提取保留了视频帧空间信息的颜色聚合向量直方图、引入了动态自适应阈值和时间阻尼 ,使得骤变检测效率高 ;对于渐变检测 ,通过分析其数学产生模型 ,根据模型特性实现渐变镜头检测 ;最后 。
叶朝阳吴飞庄越挺陈家实
关键词:视频图像序列视频流鲁棒性图像识别
足球比赛精彩场景的自动分析与提取被引量:4
2004年
提出了基于MPEG压缩域音频流的足球比赛精彩场景自动分析与提取算法 首先直接提取出压缩域音频特征 ;然后基于提取出来的压缩域特征实现解说音的检测和分割 ,并且分别识别足球比赛中解说员激动解说和观众激昂欢呼两种类型音频事件 ;最后通过概率融合生成最终结果 ,融合结果所对应的比赛片段就是提取出的足球比赛精彩场景
陈忠克郭振江刘骏伟吴飞庄越挺
关键词:MPEG音频
虹膜自相似性识别方法研究被引量:16
2004年
针对虹膜的纹理变化细节具有自相似性的特点 ,在传统的分形理论基础上 ,提出一种新的分形维数———变化分数维作为其特征 ;然后使用增量支持向量机对不同条件下获得的虹膜样本进行学习 ,所得的增量支持向量机用于识别测试虹膜样本 实验表明文中方法是可行的 ,变化分数维较好地反映了虹膜的纹理变化特性 ,而把学习机制引入虹膜识别方法 。
古红英潘红吴飞庄越挺潘云鹤
关键词:自相似性增量支持向量机虹膜识别
基于隐马尔可夫链的广播新闻分割分类被引量:18
2002年
提出了使用具有模拟随机时序数据良好能力的隐马尔可夫链来完成广播新闻分割分类的算法 .首先使用含隐藏语义状态的隐马尔可夫链把原始广播新闻粗略分割分类成开始 /结束和语音两部分 ,其次应用 3个隐马尔可夫链 ,按照最大似然概率法把语音片段预识别为主持人介绍、广告和天气预报 ,最后由语义变化速率识别出新闻现场报道 ,完成广播新闻的精细分割分类任务 .
庄越挺毛祎吴飞潘云鹤
关键词:广播新闻阈值音频信号语音识别多媒体
基于增量学习支持向量机的音频例子识别与检索被引量:16
2003年
音频例子识别与检索的主要任务是构造一个良好的分类学习机 ,而在构造过程中 ,从含有冗余样本的训练库中选择最佳训练例子、节省学习机的训练时间是构造分类机面临的一个挑战 ,尤其是对含有大样本训练库音频例子的识别 由于支持向量是支持向量机中的关键例子 ,提出了增量学习支持向量机训练算法 在这个算法中 ,训练样本被分成训练子库按批次进行训练 ,每次训练中 ,只保留支持向量 ,去除非支持向量 与普通和减量支持向量机对比的实验表明 ,算法在显著减少训练时间前提下 。
吴飞庄越挺潘云鹤
关键词:支持向量机
基于独立关键子块的图像检索新方法被引量:8
2003年
传统文本检索中很多好的方法很难在图像检索中得以应用 ,因为文本检索是基于关键字进行相似信息检索的 为了有效利用文本检索中业已存在的好方法 ,提出基于独立关键子块进行图像检索的新方法 :首先通过独立分量分析方法得到图像独立关键子块空间 ,然后使用模糊支持向量机去识别每幅图像中所包含的独立关键子块 。
潘红吴飞赵雪雁刘骏伟
关键词:独立分量分析模糊支持向量机图像检索
共3页<123>
聚类工具0