魏莹
- 作品数:4 被引量:10H指数:2
- 供职机构:东北师范大学物理学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于语谱图行投影的特定人二字汉语词汇识别被引量:6
- 2017年
- 将图像处理技术应用到语音识别领域,在图像特征提取过程中,首先对语谱图进行等宽度分带行投影和二进宽度分带行投影,分别作为窄带语谱图的第1个特征集合和第2个特征集合,同时将语谱图进行再次图像傅里叶变换之后进行等宽度行投影,作为第3个特征集合。将上述3个特征集构造为特定人二字汉语词汇识别的特征向量,以支持向量机为分类器进行特定人二字汉语词汇整体识别。采用1000个语音样本进行仿真实验,结果表明,该方法对特定人二字汉语词汇的识别率可达92.8%,为汉语词汇的识别提供了新的思路。
- 梁士利魏莹潘迪张玲许廷发王双维
- 关键词:通信技术语音识别语谱图支持向量机
- 语谱图二次傅里叶变换特定人二字汉语词汇识别被引量:2
- 2017年
- 以语音信号的语谱图作为处理对象,提出了基于语谱图二次傅里叶变换对特定人二字词汇识别的方法.首先对语谱图二次傅里叶变换频域图的图像意义以及相应的语音特性表征进行了详细剖析;然后对语谱图频域图像进行二进宽度行投影,将投影值作为语音识别特征值,以支持向量机为分类器,进行特定人二字词汇语音整体识别.采用1 000个语音样本进行了仿真实验.结果表明,该方法正确识别率可达到92.4%,为汉语词汇整体识别提供了新的思路.
- 潘迪梁士利魏莹李广岩许廷发王双维
- 关键词:语谱图支持向量机
- 宽窄带语谱图融合分带投影的特定人汉语词汇识别被引量:1
- 2016年
- 提出一种基于宽窄带语谱图融合分带投影的方法对特定人二字汉语词汇进行识别。该方法将图像处理技术应用到语音识别领域,在图像特征提取过程中,首先对窄带语谱图进行等宽度分带行投影和二进宽度分带行投影,并将其分别作为窄带语谱图的第1个特征集合和第2个特征集合,同时将窄带语谱图进行再次图像傅里叶变换之后进行等宽度行投影,作为第3个特征集合。然后对宽带语谱图进行等宽度分带列投影,作为第4个特征集合。将上述特征集合作为识别的特征向量,以支持向量机为分类器进行特定人二字汉语词汇整体识别。采用1000个语音样本进行仿真实验,结果表明,采用前3个特征集合的特征向量对特定人二字汉语词汇识别的正确识别率可达92.4%,采用第4个特征集合的特征值对特定人二字词汇识别的正确识别率可达80%,而采用上述4个特征集合的特征值融合对特定人二字汉语词汇识别的正确识别率可达95.4%。该特征融合的方法为汉语词汇的识别提供了新的思路。
- 魏莹王双维潘迪张玲许廷发梁士利
- 关键词:语音识别语谱图
- 语谱图傅里叶变换的二字汉语词汇语音识别被引量:1
- 2017年
- 以语音信号的语谱图作为处理对象,提出一种基于宽窄带语谱图傅里叶变换频域图像二进宽度分带投影特征融合的二字汉语词汇语音识别算法。首先,对宽窄语谱图傅里叶变换频域图的图像意义以及相应的语音特性进行分析;然后,分别对宽窄带语谱图频域图像进行二进宽度分带列投影和行投影,将投影值作为语音识别的第一个特征参数集合和第二个特征参数集合,将以上两个特征集进行特征融合作为二字词汇语音识别的特征量,以支持向量机为分类器实现二字汉语词汇语音识别。实验结果表明,该方法对特定人二字汉语词汇语音的识别率可达96.8%,对非特定人二字汉语词汇语音的识别率可达98.8%,为解决汉语词汇整体语音识别提供了一种新的思路。
- 潘迪梁士利魏莹许廷发王双维
- 关键词:傅里叶变换语谱图支持向量机