国家自然科学基金(69935010) 作品数:13 被引量:195 H指数:7 相关作者: 吴立德 朱兴全 李波 周兵 欧嘉致 更多>> 相关机构: 复旦大学 北京航空航天大学 微软公司 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
一种自动门限选取的视频Shot分割方法 被引量:37 2000年 文中首先针对镜头Shot分割在基于内容的视频检索中的重要性,介绍了现在普遍采用的镜头分割新方法,同时针对这些方法的不足,提出了一种基于自动门限选取的镜头分割及分类方法,该方法能同时检测视频中的突变(break)、缓变(gradual)等镜头变换和视频中的闪光灯以及运动区域.通过实际测试。 朱兴全 薛向阳 吴立德关键词:镜头分割 镜头分类 视频检索 多媒体 iFind:一个结合语义和视觉特征的图像相关反馈检索系统 被引量:88 2002年 给出了一个结合语义与视觉特征信息的图像相关反馈检索系统—— i Find.系统通过图像的标注信息构造语义网络 ,并在相关反馈中与图像的视觉特征相结合 ,有效地实现了在两个层次上的相关反馈 ,在基于内容的图像检索中取得了较为理想的效果 ,具有一定的应用价值 . 朱兴全 张宏江 刘文印 吴立德关键词:视觉特征 图像语义 多媒体数据库 图像分割 计算机 基于PLS和GAs的径基函数网络构造策略 被引量:8 2002年 鉴于传统径基函数网络(radial basis function network,简称RBFN)构造策略的不足,提出了基于偏最小二乘法(partial least squares,简称PLS)和遗传算法(genetic algorithms,简称GAs)的RBFN构造策略和一种更有效的径基宽度取值方法.在这个集成构造策略中,PLS克服了K-Means算法求取径基易陷入局部最优的弊病,并使合成径基比由正交算法获取的径基更具代表性;而所提出的径基宽度取值方法和GAs则为网络性能和结构的实质性改善与优化提供了保障.实验证实了基于PLS和GAs的RBFN构造策略及所提出的径基宽度取值方法的优越性、可靠性和有效性. 赵伟祥 吴立德关键词:PSL GAS 聚类 偏最小二乘回归 遗传算法 基于向量空间模型的Web中文信息过滤系统 被引量:6 2003年 提出了一种基于VSM的自适应的Web信息过滤系统的设计及实现方法.与传统的信息过滤系统相比,Web上的信息过滤系统具有许多全新的特征.页面为半结构化的文档、页面上的噪声信息比较多,用户提交的正例比较少.这些特性成为影响过滤性能的主要因素.针对Web的上述特性设计的Fudanfilter2002过滤系统,具有使用方便、过滤时间短、精度高等特点. 胡恬关键词:信息过滤 向量空间模型 自适应 新闻视频、音频中的主题检测 被引量:1 2002年 Topic Detection in News Video and Audio is to automatically detect snippets with a topic the user searches for, in the news streams, including video,audio and broadcasting. It is a novel research scope rises along with the rapid development of multimedia technology, automatic speech recognition and natural language processing. This technology detects the topic of the news in the semantic level and fits for most people's retrieval need. 陈凯江 欧嘉致 黄萱菁 吴立德关键词:语音识别 自然语言处理 新闻视频 音频 主题检测 新闻节目 一种新的利用多帧结合检测视频标题文字的算法 被引量:8 2005年 视频中的标题文字通常在视频信息索引和检索中起到重要作用.提出了一种新的视频标题文字的检测算法.首先采用一种新的多帧结合技术来降低图像背景的复杂度,它基于时间序列对多帧图像进行最小(或最大)像素值搜索,搜索的具体方式由Sobel边缘图来决定.然后以块为单位来进行文字与非文字的分类,即用一扫描窗口对图像进行扫描,以Sobel边缘为特征,判断其是否为文字.一个2级的金字塔被用来检测不同大小的文字.最后,提出一种新的迭代的文字区域分解方法,它能够更精确地定位文字区域的边界.实验结果表明,这种文字检测算法能够取得很高的精度和召回率. 王蓉蓉 金万军 吴立德关键词:视频 基于自适应搜索的快速运动估计算法 被引量:14 2001年 在MPEG和H .2 63的运动估计中 ,全搜索 (FS)效果虽好但时间开销巨大 ,以三步搜索法为代表的一些快速算法不仅在搜索精度方面与FS相比有较大的差距 ,而且搜索时间仍不能满足实际的需要 .提出的基于自适应搜索的快速运动估计算法 (ASA)充分利用了视频序列运动矢量在空间分布上的中心偏置特性和相邻块运动的相关性 ,在大幅度提高搜索效率的情况下 ,得到了与全搜索非常接近的搜索效果 .与现有算法相比 ,该算法具有高效、鲁棒性强的特点 . 李波 涂亚明关键词:编码器 搜索算法 块匹配 MPEG 在MPEG视频上的语义视频对象分割改进算法 被引量:4 2003年 随着MPEG 4 ,MPEG 7等标准的提出 ,如何提取语义视频对象已成为当前视频压缩和检索领域共同的研究课题 特别是MPEG - 7对视频对象的形状检索提出了具体要求 针对顾创等人的WaterShed算法不能很好处理现有MPEG 1视频数据的缺陷 ,提出改进算法 ,从而能够在MPEG视频流中提取到具有光滑轮廓的语义视频对象 算法主要有以下两点改进 :提出将类成员数作为分类算法的参数 ;在压缩域和解码后的图像上先后进行两次分割 实验结果表明 ,改进算法在鲁棒性和分割结果精度上比原算法有较大的改进 。 任和 梅林 吴立德关键词:语义视频对象 视频检索 图像分割 MPEG An Image Compression Algorithm Based on Hybrid Coding Zerotree,bit plane and arithmetic coding are widely used in image compression algorithms based on wavelet tran... Wang,Ren Li,Bo一种在小样本情形下求解广义最佳鉴别矢量集的新算法及其在人脸识别中的应用 2002年 一、引言
线性特征抽取是一种有效的降维方法,到目前为止,人们给出了许多线性特征抽取方法[1,2],就鉴别能力来说,Foley-Sammon变换(FST)[3]被认为是最好的方法之一,FST是根据用于线性鉴别问题的Fisher鉴别准则[4]得到的,1970年,Sammon给出了基于Fisher准则的最佳鉴别平面[5],1975年Foley和Sammon推广了Sammon的方法,给出了最佳鉴别矢量集的结果,并以此构成了FST.Foley和Sammon的重要结果吸引了众多模式识别领域中的研究者[6~14],特别是对类内散布矩阵Sw为奇异的情形,人们作了许多工作,并取得了良好的结里[2,6,11~13].…… 郭跃飞