徐光祐 作品数:151 被引量:2,608 H指数:25 供职机构: 清华大学信息科学技术学院计算机科学与技术系 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中国博士后科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 文化科学 天文地球 更多>>
中国多媒体技术研究:2004 被引量:10 2005年 该文是中国多媒体技术研究与应用的年度文献综述之七,其是在查阅了2004年9种核心刊物的2 926篇文章的基础上,从中选取了363篇多媒体技术相关的文章进行了分类、统计,以展现出2004年中国多媒体技术发展的现状。同时,通过对比前4年的统计结果可以看到,数字水印、虚拟现实、多模态接口、多媒体信息检索、服务质量保证、计算机支持的协同工作、地理信息系统和数字地球等这些国际热门技术在国内也受到了高度的重视。该文还对5年来中国多媒体技术文献统计结果做了比较,从中可清楚地看到多媒体技术,尤其是热点技术的发展过程和发展趋势。该文不仅给从事多媒体技术研究与应用的人员提供了一个很好的文献资料的索引,也给论文作者和刊物编辑一个好的参考。 徐光祐 贺伟晟 史元春关键词:多媒体 虚拟现实 超媒体 多媒体通信 CSCW 无线多媒体 纹理约束下的人脸特征点跟踪 被引量:25 2004年 将Lucas-Kanade光流跟踪算法与人脸特征点定位的统计模型DAM(direct appearance model)在Bayesian框架下结合起来,提出了视频中人脸特征点定位与跟踪的一种混合模型方法.利用Lucas-Kanade算法预测人脸特征点的位置,充分利用了帧间的相关信息,提高了跟踪的速度.通过DAM中纹理对形状的约束,在提高跟踪精度的同时增强了整个算法的鲁棒性.实验表明,这种方法可以很好地适应人脸的多种运动,可用于人脸识别或3D人脸建模. 宋刚 艾海舟 徐光祐关键词:光流 特征点定位 特征点跟踪 面向流水线结构的并行匹配算法 被引量:5 1993年 本文提出一种面向流水线计算机的立体视觉并行匹配算法,使立体视觉算法所需的低层视觉信息处理和特征匹配都能在具有高速视频总线的流水线计算机中完成,这样既简化了视觉系统的结构,又大大提高了处理速度.匹配中应用了排序、方向和幅度约束作为相似性判断,并根据匹配点邻域中的视差梯度,利用松弛迭代法提高匹配的可靠性.算法已在PIPE流水线计算机上实现,256×256图像的立体视觉算法可在10秒内完成. 徐光祐 李经纬 杨士强 石定机关键词:立体视觉 新闻视频显著人脸检索系统 被引量:1 2003年 该文针对新闻视频设计并实现了一个显著人脸检索系统。首先将新闻视频分割成镜头序列,利用训练好的CascadeAdaboost人脸检测器对每个镜头检测出一定数目的候选人脸,按照一些规则选取可信度高的作为样本,用于提取该镜头内的肤色模型。接着对肤色分割后的区域进行位置、大小分析和模板匹配,以淘汰非人脸区域,确定待跟踪的对象列表。为了做精确的跟踪和识别,系统对每个跟踪对象建立更细致的肤色模型。跟踪过程中每间隔一定帧数重新进行人脸检测,以减少误差积累和探测是否有新人脸出现。最后从每个人脸序列挑选最适合进行人脸识别的图像建立其特征脸空间,结合肤色信息和PCA算法判断其是否为要检索的目标人脸。 黄玫 孙兴华 金国英 徐光祐关键词:CASCADE ADABOOST 人脸检索 肤色模型 自然的人体动作识别 人体动作识别是计算机视觉的一个重要研究课题。目前大多数动作识别的研究都假设是在特定受限的场景下,即特定的视角、位置、对象、背景和光照条件下工作。其中,尤以要求特定的视角和位置对实际应用的限制最为严重。本文致力于研究能处理... 黄飞跃 徐光祐关键词:人体动作识别 智能家居 文献传递 中国多媒体技术研究:2002 被引量:5 2003年 为了使人们对中国多媒体技术现状有个概略了解 ,特编写了中国多媒体技术研究与应用的年度文献综述之五 .通过查阅国内 2 0 0 2年 9种核心刊物的 2 76 1篇文章 ,从中选取了 4 6 4篇与多媒体技术相关的文章 ,进行分类、统计 ,同时 ,结合前 4年的统计结果 ,又将近 5年的多媒体技术文献统计结果做了比较 ,由此可清楚地看到多媒体技术 ,尤其是热点技术的发展过程和发展趋势 .该文不仅给从事多媒体技术研究与应用人员提供了一个很好的文献资料的索引 ,也给论文作者和刊物编辑人员提供了一个好的参考 . 徐光祐 车轶 史元春关键词:多媒体技术 文献统计 面向普适计算的扩展的证据理论方法 被引量:15 2004年 普适计算作为一种新型计算模式 ,从根本上改变人们对什么是计算的思考 .由于它需对多源信息进行融合 ,因此该文作者认为它是一种包含融合计算的模式 ,能通过多层次、多视角的融合 ,为人们提供更方便的信任度高的访问信息和计算服务 .基于普适计算应用的需要 ,该文讨论了扩展的证据理论方法 ,该方法采用可靠性因子评估多源证据觉察上下文信息 ;引入时效函数衡量多源证据的有效性与时间的关系 ,并将其组合到信任函数中 ,描述信任mass的时变规律 ;利用功率来度量多源证据觉察上下文信息间的相关程度 ,并通过去相关将其转化为相互独立的证据 ,扩展和完善了经典证据理论提供的方法 ,弥补了其不足之处 ,提高了不同应用场合下服务的质量 (QoS) ,确保了普适计算的服务宗旨 .利用支持普适计算模式的智能空间中的场景 ,验证了扩展的有效性 . 张德干 徐光祐 史元春 赵海 陈恩义关键词:普适计算 证据理论 觉察上下文 可靠性 独立性 说话人识别中语音切分算法的研究 本文提出了4种语音切分新算法,在不同程度上消除了能量变化和噪声对切分的影响,应用于若干说话人识别系统,取得了良好的效果. 何致远 胡起秀 徐光祐关键词:说话人识别 文献传递 视角无关的动作识别 被引量:14 2008年 人体动作识别是计算机视觉中一个流行而且重要的研究课题.当观察视角发生变化时,动作识别变得格外困难.至今为止,关于动作识别和手势识别的大多数研究工作都是围绕着视角相关的表达展开的.有一小部分利用了视角不变的表示开展研究,可是它们大多数存在一些缺陷,比如缺少用于识别的足够信息,依赖鲁棒的语义特征点的检测或者是点对应.为了解决这个问题,实现视角无关、动作人无关的动作识别,提出了"包容形状"的表示,这种表示不依赖于特定视角.在人体动作识别中,人的身体旋转通常是引起视角变化的主要原因.包容形状充分利用了两个正交摄像机拍摄的轮廓信息以去除由人的身体旋转产生的影响.从来自两个正交的摄像机拍摄的外轮廓,可以很容易计算得到包容形状.利用包容形状的体态表示和隐马尔可夫模型,取得了非特定人、任意视角下动作识别的很好的实验结果.这些实验结果也表明了包容形状包含有足够区分度的信息.同时提出了包客形状的扩展表示,以便在两个摄像机并不完全正交的更为一般的摄像机配置条件下也可以应用,这极大地加强了其实用价值. 黄飞跃 徐光祐关键词:隐马尔可夫模型 利用物体的归一化偏差本体反射特征进行彩色图像的分割 1995年 本文提出了一种基于物体的归一化偏差本体反射特征进行彩色图像分割的方法。通过对成像过程的分析,我们应用了光照和表面反射率的有限维线性模型(Finite-Dimensional Linear Model)和双色反射模型(Dichromatic Reflection Model),将光源因素以及几何因素分离出来,经过做归一化处理后的偏差光谱反射率已消除了光照和几何条件的影响,代表物体固有的颜色特性,因此可做为分割和识别物体的可靠依据。在实验图像中同时存在着耀斑、影调和暗区等区域,为此采用初始分割对这些区域分别处理。此外,本文还通过采用将区域生长与边缘约束相结合的方法,进一步提高了分割的可靠性。 徐光祐 刘立峰关键词:图像分割