国家自然科学基金(60872115) 作品数:12 被引量:50 H指数:4 相关作者: 万旺根 余小清 许雪琼 李昌莲 常辽豫 更多>> 相关机构: 上海大学 南昌大学 更多>> 发文基金: 国家自然科学基金 上海市教育委员会重点学科基金 上海市科委国际合作基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于改进型BP神经网络的音频多分类 被引量:4 2012年 音频信号作为多媒体信息的重要载体之一,为满足人们对信息知识的获取提供了有效途径.为了提高音频分类的精度,提出一种将音频信号的梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)参数作为特征向量,采用基于改进型传输函数的误差反向传播神经(back propagation,BP)网络模型对6种音频进行分类.实验证明,该方法在音频分类精度方面性能良好,改进的传输函数具有收敛速度快的优点.相对于传统BP算法,该方法不仅缩短了训练时间,而且进一步提高了分类精度,其分类准确率达到90%以上. 刘军伟 余小清 万旺根 张静 杨薇关键词:传输函数 BP神经网络 收敛速度 音频分类 结合图像信号显著性的自适应分块压缩采样 被引量:8 2013年 均匀分块压缩感知对图像信号进行压缩采样,无法有效地分离出重要区域和背景区域。为此,提出一种基于显著性的自适应分块压缩采样方法。根据图像信号的显著性,利用四叉树算法进行自适应图像分块,有效分离出重要区域和背景区域。根据区域块的显著度动态设置观测值数量,重要度区域设置高采样率,背景区域设置低采样率,从而提高重要区域的图像重建质量。实验分析表明,在得到更好的视觉效果同时,本文算法观测值数量较少,且重构图像的峰值信噪比(PSNR)、平均结构相似性(MSSIM)指标,以及运行时间均优于均匀分块压缩采样算法。 王瑞 余宗鑫 杜林峰 万旺根关键词:视觉显著性 自适应分块 四叉树算法 低信噪比环境下基于PR的音频分割 2010年 针对当前不同的非白噪声背景研究很少,根据噪音、语音和音乐的性质并且结合统计学理论,提出一种在不同噪声背景下低信噪比的语音/音乐分割算法。以往的检测算法很少考虑低信噪比的环境,首先从音频数据中提取新的特征参数概率密度比(probability density ratio,PR)和概率密度比过零率(probability density ratio crossing rate,PRCR),特征参数在低信噪比环境下亦能明显表征语音和音乐的不同特性,然后根据音频的特性对PRCR进行修正,再基于此修正的特征参数对语音和音乐进行改变点检测,最后得到分割结果。实验结果显示,在信噪比达到5dB时分割点准确率达到85%以上,具有良好的鲁棒性。 李昌莲 余小清 许雪琼 万旺根关键词:低信噪比 基于粗糙集理论与支持向量机的纳税评估模型 被引量:5 2009年 研究纳税评估是对纳税人纳税情况进行评价的一种管理模式。为了区分纳税人是否正常申报税款,融合了粗糙集理论与支持向量机机器学习方法的优点,提出了一种新的纳税评估模型。通过选取纳税申报表中的指标,建立纳税评估指标体系,并利用粗糙集理论对指标进行属性约简,采用支持向量机对纳税人进行分类处理,建立了纳税评估模型。最后对上述模型进行了实例验证,实验结果表明,模型具有良好的纳税评估预测性能。 刘晗 余小清 万旺根 马秀丽关键词:粗糙集 支持向量机 纳税评估 基于本体的用户兴趣模型构建研究 被引量:21 2010年 针对用户兴趣模型中本体构建和模型更新的难点和不足,提出一种基于本体论的用户兴趣模型构建方法,该方法通过领域本体、用户个性本体、校正本体和本体更新实现模型的构建。对于领域本体的构建,摒弃了训练、学习和聚类的方法,直接从开放目录专案获取类目。对于用户兴趣的更新,采用按照校正本体增加、淘汰和传递原理调整相结合的方式。实验结果表明,该模型较易生成,用户兴趣的准确度和更新的及时性都有所提高。 陈一峰 赵恒凯 余小清 万旺根关键词:本体 基于遗传算法的主题爬虫策略改进 被引量:5 2010年 针对主题爬虫存在"主题漂移"的问题,为了快速抓取网页,提出了一种基于遗传算法的主题爬行改进策略。在现有遗传算法爬行策略的基础上新引入了PageRank算法,调整了以往网页主题相关度计算方式,以计算得到的网页PageRank和相关度值为依据来选择爬行中的遗传因子,并重新设置了适应度函数,在保证优越遗传因子(与主题相关且重要网页)被优先遗传的同时,减少了遗传因子在传递过程中的"主题漂移",从而使爬行到网页的重要性和主题相关性均有所提高。与以往基于遗传算法的策略相比较,在不影响查全率的情况下,与主题相关且重要的网页数可提升5%以上。 陈一峰 赵恒凯 余小清 万旺根关键词:主题爬虫 遗传算法 网页信息 基于ADV7183B的视频解码系统的设计 被引量:1 2009年 利用MSP430F169控制视频解码芯片ADV7183B处理复合视频、S-Video和色差分量的视频输入源,从而输出8 bit/16 bit CCIR656的YCrCb型4:2:2的数字视频数据,再将其进一步进行格式转换、滤波等处理,通过DVI接口显示。 王旭智 马艳茹 杨胜齐 李思关键词:数字视频 MSP430F169 视频解码 改进波形相似叠加算法的音频时长调整 被引量:2 2009年 针对波形相似叠加算法在处理高采样率音频时效率低的缺点,提出由短时均值包络到细化波形的逐步匹配方法.首先基于短时均值包络进行粗匹配,在此基础上细化包络,进行再匹配以实现音频时长调整.该算法降低了计算量,提高了运算效率.在进行音频时长调整过程中,还利用音频的优化低能量率特征参数动态调整分析窗长度,实验表明这种处理方法对混合音频的处理效果有很大改进. 许雪琼 余小清 李昌莲 万旺根MP3压缩域中语音分割的研究与实现 被引量:3 2009年 针对说话人改变点检测问题,在MP3格式下用改进型B IC算法实现了多话者改变点的检测。根据非压缩域中MFCC的求取过程,提出了一种在压缩域MP3格式下利用MDCT系数计算MFCC特征参数的新方法。在此基础上,使用改进型B IC改变点检测算法检测说话人改变点。实验表明在相同的B IC检测算法下,利用在压缩域中提取的MFCC特征参数进行语音分割,可以得到和非压缩域相似的分割精确度。 常辽豫 余小清 万旺根 李昌莲 许雪琼关键词:压缩域 语音分割 基于非线性变换法语谱图的伪彩色显示 被引量:1 2010年 鉴于人眼对彩色的分辨率远远高于灰度差分辨率的特点,提出了一种利用C#程序实现伪彩色显示的新方法,该方法通过非线性映射变换函数,建立频谱幅度与颜色的对应关系,从而实现伪彩色显示,并将其用于语谱图显示及语音信号处理界面设计中;此外,还将语音播放功能加入语谱图显示过程中,实现了"可视"语言的播放。该方法编程简单,界面设计灵活,对设备的要求较低,在普通PC机上即可实现。 张静 余小清 许雪琼 常辽豫 万旺根 李昌莲关键词:语谱图 伪彩色 灰度 调色板 映射变换