江苏省高校自然科学研究项目(05JKB510113)
- 作品数:16 被引量:68H指数:4
- 相关作者:陶智赵鹤鸣顾济华施晓敏张晓俊更多>>
- 相关机构:苏州大学华中科技大学更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金国家大学生创新性实验计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于概率神经网络的汉语耳语音识别系统被引量:3
- 2008年
- 以提高汉语耳语的识别率为目的,提出了基于概率神经网(PNN)的语音识别系统。实验结果说明该方法提高了系统的识别率,大大缩短了识别时间,提高了整个系统的实时性。在小字库内得出的识别率为94.7%。
- 荣薇陶智顾济华赵鹤鸣
- 关键词:耳语音语音识别MFCC参数神经网络
- 基于听觉感知的电子耳蜗共振峰提取方案被引量:1
- 2007年
- 使用听觉感知的小波变换来提取电子耳蜗中的共振峰参数。首先用听觉感知的小波变换对原始语音信号进行分解重构,然后分别用自相关和格型法对合成语音信号和原始语音信号进行共振峰提取。实验结果表明:使用听觉感知的小波变换进行共振峰参数提取的可行性,合成语音信号能更好地表征原始语音信号的特征;同时也证实了电子耳蜗语音处理器中使用由格型法提取共振峰参数比自相关法更精确。
- 施晓敏顾济华陶智赵鹤鸣张晓俊
- 关键词:听觉感知电子耳蜗
- 基于AD神经网络的耳语音增强的研究被引量:2
- 2007年
- 论文针对带噪的耳语音提出了一种利用ADALINE神经网络消除背景噪声的耳语音增强算法。首先利用传统的谱减法来取得较好的谱包络,在此基础上使用AD线性神经网络进行自适应预测以达到提高耳语音质量的目的。结果表明,即使在低信噪比的情况下,信噪比也能提高20dB左右,而且取得了良好的听觉效果。
- 孙静陶智顾济华赵鹤鸣
- 关键词:耳语音语音增强线性神经网络
- 基于听觉感知小波变换的电子耳蜗CIS语音信号处理被引量:3
- 2006年
- 为克服以往滤波器组参数调整复杂,提出了一种听觉感知的小波变换的电子耳蜗语音处理的方法。文章在连续交替取样CIS(ContinuousInterleavedSampling)语音信号处理方案的基础上,利用人耳听觉的临界频率与听觉感知的小波变换域的相似性,进行了电子耳蜗输出信号的重构,采用短时傅立叶变换的语谱图分析。实验结果表明:本方法获得的合成语音与原始语音在频谱包络特征上非常相似,频域特征更接近人耳的实际生理特性。
- 施晓敏顾济华陶智赵鹤鸣张晓俊
- 关键词:电子耳蜗
- 基于PCNN和DTW的语音识别系统设计被引量:1
- 2006年
- 提出了一种基于脉冲耦合神经网络(PCNN)和动态时间规整(DTW)的语音识别方法。首先利用改进后的PCNN提取语谱图图像特征作为语音的特征参数,然后通过DTW来进行语音分类识别。实验表明,论文中所提出的方法与传统的LPCC和MFCC方法相比,所需特征参数量减少约40%,并能达到87.5%识别率,利于系统的硬件实现。
- 张晓俊陶智顾济华赵鹤鸣施晓敏
- 关键词:脉冲耦合神经网络动态时间规整语音识别语谱图
- 基于HHT的耳语音声韵分割
- 分割的功能是通过某种算法找到声母和韵母之间的分割点,是耳语音识别及转换的前期工作。本文运用HHT,对耳语音进行声韵分割。通过对耳语音样本的声韵分割实验,本文算法的检测正确率高于相对消法,算法有效性得到了验证。
- 谈雪丹顾济华陶智吴迪
- 关键词:耳语音
- 一种Bark子波变换的电子耳蜗语音增强算法被引量:3
- 2008年
- 提出了一种Bark子波变换的电子耳蜗语音增强算法。该算法首先引入与人耳听觉系统更为适应的Bark子波变换来进行电子耳蜗CIS语音信号处理,然后在每个Bark通道中利用非线性谱减法对其进行语音增强,谱减法的参数由人耳隐蔽阈值来控制。结果表明:即使在低信噪比的情况下,信噪比也能提高16dB左右,合成的语音对于电子耳蜗使用者具有较好的清晰度和可懂度。
- 黄雅婷顾济华陶智赵鹤鸣吴迪
- 关键词:电子耳蜗语音增强
- 基于HHT瞬时能频值的含噪耳语音声韵分割被引量:1
- 2010年
- 提出了一种基于希尔伯特-黄变换瞬时能频值的含噪耳语音声韵分割算法。根据耳语音声韵母幅频特性,运用HHT,分离出耳语音中高频部分的瞬时幅值与频率,同步去除低频噪声,提取出能够反映声韵母过渡信息的特征参数——瞬时能频值,利用该参数对耳语音进行声韵分割。实验结果表明:与相对熵算法相比,该算法对含噪耳语音进行的声韵分割正确率较高,能够较准确地进行耳语音声韵分割。
- 谈雪丹顾济华赵鹤鸣陶智沈圆圆
- 关键词:耳语音希尔伯特-黄变换
- 基于PCNN和DTW的语音识别系统设计被引量:4
- 2007年
- 提出了一种基于脉冲耦合神经网络(PCNN)和动态时间规整(DTW)的语音识别方法。首先利用改进后的PCNN提取语谱图图像特征作为语音的特征参数,然后通过DTW来进行语音分类识别。实验表明,论文中所提出的方法与传统的LPCC和MFCC方法相比,所需特征参数量减少约40%,并能达到87.5%识别率,利于系统的硬件实现。
- 张晓俊陶智顾济华赵鹤鸣施晓敏
- 关键词:脉冲耦合神经网络动态时间规整语音识别语谱图
- 一种基于人耳掩蔽效应的DCT域音频水印被引量:3
- 2008年
- 文中提出了一种基于听觉掩蔽效应的DCT域音频水印算法。首先根据人耳听觉系统的心理声学模型估算每帧音频数据的掩蔽阈值,然后利用量化的思想将水印信号自适应地嵌入到掩蔽阈值以下的频率分量所对应的DCT域系数中。仿真实验结果表明:与传统DFT方法相比,该算法具有更好的透明性和鲁棒性。
- 吴俊顾济华陶智赵鹤鸣黄传霞
- 关键词:音频水印听觉掩蔽离散余弦变换