您的位置: 专家智库 > >

李拟珺

作品数:11 被引量:20H指数:3
供职机构:东南大学信息科学与工程学院水声信号处理教育部重点实验室更多>>
发文基金:国家自然科学基金北京市重点实验室开放基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术电子电信文化科学更多>>

文献类型

  • 9篇期刊文章
  • 2篇会议论文

领域

  • 7篇自动化与计算...
  • 3篇电子电信
  • 1篇文化科学

主题

  • 4篇视觉跟踪
  • 3篇子群
  • 3篇粒子群
  • 2篇丢帧
  • 2篇视觉跟踪算法
  • 2篇像素
  • 2篇粒子群优化
  • 2篇目标跟踪
  • 2篇SIFT
  • 2篇SIFT特征
  • 2篇G.722
  • 1篇单通
  • 1篇单通道
  • 1篇多目标
  • 1篇多目标跟踪
  • 1篇多速率
  • 1篇多特征融合
  • 1篇信噪比
  • 1篇信噪比估计
  • 1篇语音

机构

  • 11篇东南大学
  • 2篇安徽师范大学
  • 2篇南京农业大学
  • 1篇佛山科学技术...

作者

  • 11篇李拟珺
  • 10篇吴镇扬
  • 8篇程旭
  • 5篇周琳
  • 3篇周同驰
  • 3篇郭海燕
  • 2篇王仕奎
  • 1篇孙明
  • 1篇张索非
  • 1篇李枭雄
  • 1篇徐勤军
  • 1篇赵小燕

传媒

  • 4篇东南大学学报...
  • 1篇电子与信息学...
  • 1篇中国科学技术...
  • 1篇Journa...
  • 1篇中国图象图形...
  • 1篇重庆邮电大学...
  • 1篇2012年全...

年份

  • 2篇2015
  • 4篇2014
  • 1篇2013
  • 2篇2012
  • 1篇2011
  • 1篇2010
11 条 记 录,以下是 1-10
排序方式:
Action recognition using a hierarchy of feature groups
2015年
To improve the recognition performance of video human actions,an approach that models the video actions in a hierarchical way is proposed. This hierarchical model summarizes the action contents with different spatio-temporal domains according to the properties of human body movement.First,the temporal gradient combined with the constraint of coherent motion pattern is utilized to extract stable and dense motion features that are viewed as point features,then the mean-shift clustering algorithm with the adaptive scale kernel is used to label these features.After pooling the features with the same label to generate part-based representation,the visual word responses within one large scale volume are collected as video object representation.On the benchmark KTH(Kungliga Tekniska H?gskolan)and UCF (University of Central Florida)-sports action datasets,the experimental results show that the proposed method enhances the representative and discriminative power of action features, and improves recognition rates.Compared with other related literature,the proposed method obtains superior performance.
周同驰程旭李拟珺徐勤军周琳吴镇扬
基于SIFT特征的粒子群优化的视觉跟踪算法被引量:5
2012年
提出了一种基于SIFT(scale invariant feature transform)特征的表观模型更新的粒子群优化(particle swarmoptimization,PSO)跟踪算法。与现有的跟踪方法不同,该算法将当前帧检测到的SIFT特征与最近更新的目标模板相匹配,估计目标的位置,然后把此位置信息融入到PSO的结果中以得到更加精确的位置估计,并把其作为新的目标模板,从而更加鲁棒地应对表观模型的更新问题。实验结果表明,提出的SIFT-PSO算法在目标发生大的运动变化和局部遮挡条件下仍然能够可靠地跟踪目标。
程旭李拟珺吴镇扬
关键词:视觉跟踪SIFT粒子群优化
基于多特征融合和分层反向传播增强算法的人体动作识别被引量:6
2014年
为了推广神经网络在人体动作识别中的应用,设计了一种基于分层识别框架和增强算法的动作识别系统,该系统融合了光流直方图、有向梯度直方图、Hu的矩特征、分块剪影和自相似矩阵等多种特征.为了与反向传播网络的增强相匹配,将传统的二分类增强算法扩展到多分类版本.此外,系统采用了包含预判决和后判决的分层识别框架,前者通过分析运动显著区域的位置,把动作粗分为几个子类,后者则利用额外的特征进一步提高识别准确率.基于Weizmann和KTH数据库的实验结果表明:神经网络相对于常用的支持向量机具有明显的优越性;结合分层识别的反向传播增强算法可以极大减少运算代价与动作类间的混淆,识别准确率较高.
李拟珺程旭郭海燕吴镇扬
关键词:特征提取神经网络
基于子带信噪比估计和软判决的鲁棒双耳声源定位算法
2015年
为了提高噪声和混响环境下的双耳声源定位算法性能,提出了一种基于子带信噪比估计和软判决的双耳互功率谱和耳间时间差估计算法.首先根据每帧中每个子带双耳声信号的自相关矩阵估计子带信噪比;其次,将子带信噪比映射为软判决值,并对双耳互功率谱进行加权;最后利用加权后的互功率谱估计耳间时间差,从而判断目标声源方位.仿真测试和实际环境测试均表明:与基于互相关函数、过零率的传统双耳声源定位算法相比,所提算法在噪声和混响的复杂声学环境下,显著提高了双耳声源定位性能.
周琳赵小燕程旭李拟珺吴镇扬
关键词:软判决
改善G.722.2丢帧隐藏性能的宽带独立编码算法设计
由于ITU-T的G.722.2编码标准帧间激励的依赖性,导致其对丢失浊音端点十分敏感,会造成严重的错误传播。为改善其性能,设计了与G.722.2结合的宽带独立编码算法,它是由iLBC(internet Low Bit-r...
李拟珺王仕奎孙明吴镇扬
关键词:自适应多速率
文献传递
基于基频状态和帧间相关性的单通道语音分离算法被引量:1
2014年
提出一种基于基频状态和帧间相关性的单通道混合语音分离算法.首先,从混合语音中提取2个源语音的基频进行状态编码,基于编码的基频状态构造自适应字典,并通过引入基频信息在字典层面对各源语音信号进行区分.然后,采用频繁模式挖掘算法,提取基频状态为1时字典的频繁1项子集,缩减字典尺寸.最后,以基于正交匹配追踪的分离语音为基础,检测分离效果差的混合语音帧,搜索与其相关度最高的平移后的邻近分离语音帧进行叠加,并采用软掩蔽方法进行第二次分离校正.仿真实验结果表明,该算法获取的分离语音信噪比优于现有的2种经典语音分离算法,并且该算法采用频繁模式挖掘算法大大减小了运算量.
郭海燕李枭雄李拟珺周琳吴镇扬
关键词:语音分离稀疏分解正交匹配追踪基频
一种基于超像素的局部判别式跟踪算法被引量:3
2014年
针对目标在复杂环境下容易受到外界干扰而发生漂移的问题,提出了一种基于超像素的局部判别式跟踪方法.首先,对视频序列前10帧的目标区域进行分割,得到超像素,并利用kmeans方法对其进行聚类以构造初始字典;其次,通过训练样本集来训练线性分类器;然后,为了减少目标发生漂移的可能性,将初始训练的分类器与更新后的分类器线性加权之和定义为似然函数;最后,在粒子滤波的框架下,将似然函数值最大的粒子作为跟踪的结果,每运行U帧更新一次字典和分类器参数,以捕获目标表观的变化.仿真结果表明,所提算法在目标发生遮挡、光照变化的复杂环境下仍然能够跟踪目标.
程旭郭海燕李拟珺周同驰周琳吴镇扬
关键词:视频监控目标跟踪
等级关联的粒子群迭代多目标检测跟踪被引量:1
2013年
针对目标在跟踪过程中受环境变化影响(光照、遮挡等)使其跟踪发生偏移的问题,提出一种从目标粗匹配到粒子群算法精确定位的等级关联结构的多目标跟踪算法。与现有跟踪算法相比,在粗匹配阶段粒子随机产生过程中融入了上下文信息,提高了目标匹配的准确度,降低了错误跟踪的目标数;对于在粒子群精确定位阶段有显著偏差的目标位置,采用Metropolis-Hastings采样算法进行纠正,同时完成模板更新,从而保证了目标跟踪的准确性。实验结果表明,该算法在目标被遮挡的情形下能够准确地跟踪被遮挡的目标。
程旭李拟珺张索非吴镇扬
关键词:视觉跟踪目标检测多目标跟踪粒子群算法
稀疏表示的超像素在线跟踪被引量:5
2014年
目标表观变化的处理是视觉跟踪领域极具挑战性的问题,该文针对这一问题,在粒子滤波框架下提出一种高效的基于超像素的L1跟踪方法(SuperPixel-L1 tracker,SPL1)。首先利用具有结构性信息的中层视觉线索(超像素)构造字典来对目标的表观建模;然后求解由粒子表示的候选目标状态的L1范数最小化,把重构误差最小的候选状态作为跟踪的结果;最后进一步改进了字典的在线更新策略,不论目标发生遮挡与否,字典都被学习更新;为了降低目标发生漂移的可能,更新时保留初始帧的信息。仿真结果验证了SPL1在目标发生长时间遮挡、尺度和光照变化时依然能够稳定地跟踪目标。
程旭李拟珺周同驰周琳吴镇扬
关键词:视觉跟踪
基于增强保护帧的G.722.2丢帧补偿算法
2011年
运用基于离散Teager能量算子的浊音端点检测技术,将浊音端点及其之后的若干帧作为丢帧补偿的增强保护帧.在研究窄带语音帧间独立编码算法iLBC的基础上,对G.722.2编码标准进行改造,使之能够对宽带输入语音进行类似的帧间独立编码,以增强其抗丢帧鲁棒性.针对不同的丢帧率,对不同数目的增强保护帧进行帧间独立编码,以编码速率的略微提高增强对丢帧的鲁棒性,因此本算法既有iLBC的鲁棒性,又有一般CELP编码的速率自适应性.实验结果表明,相对于G.722.2编码标准附件I补偿方法,本算法可以提高丢帧补偿性能,在浊音端点丢失率较高的情况下的效果更好.
王仕奎李拟珺吴镇扬
共2页<12>
聚类工具0