赵晖
- 作品数:20 被引量:75H指数:6
- 供职机构:国防科学技术大学更多>>
- 发文基金:国防科技技术预先研究基金国家部委资助项目国家部委预研基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 面向语音转换的汉语语料自动选取算法
- 2011年
- 为实现语音转换,建立符合要求的汉语语音转换语料库,提出一种基于半音节模型的语料自动选取算法。根据语音转换训练时需要语料数量较少的特征,选择半音节作为语料库的基本单位。在此基础上,从原始语料中自动选取语料,根据语音转换对说话人特征较敏感的情况,利用评估函数并根据半音节的出现次数对原始语料中的句子进行打分。实验结果表明,与传统算法相比,该算法在语音库自动选取615句汉语语料时,可以覆盖97.8%的带声调半音节,其覆盖效率、覆盖率和稀疏度有较大改进。
- 沈亚敏赵晖张权唐朝京
- 关键词:中文信息处理语音库语音转换
- 基于视频三音子的双模态语料自动选取算法被引量:3
- 2009年
- 为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。根据视频中唇部发音特征,对已有的三音子模型归类,形成视频三音子,在其基础上从原始语料中自动选取语料,利用评估函数对原始语料中的句子打分。与其他双模态语料库相比,该语料库在覆盖率等指标上有较大改进,为实现具有真实感的可视语音合成奠定基础。
- 赵晖林成龙唐朝京
- 关键词:可视语音合成评估函数
- 彩色人脸图像中的唇部区域定位方法
- 本发明提供一种彩色人脸图像中的唇部区域定位方法,技术方案包含两个步骤:唇部区域粗定位阶段和唇部区域精确定位阶段。在唇部区域粗定位阶段,将输入的彩色人脸图像利用平行线投影分割技术和肤色检测技术同时进行两种处理,并把得到的结...
- 唐朝京张权赵晖刘俭刘星彤李皓
- 文献传递
- 真实感汉语可视语音合成关键技术研究
- 可视语音合成又称语音动画合成,是指根据给定的文本或语音,合成出与文本或语音相对应的脸部图像序列,加深人们对语言内容的理解。可视语音合成技术在人机交互、影视娱乐、信息对抗等领域有着重要的应用。
本文提出了汉语大规...
- 赵晖
- 关键词:可视语音合成隐马尔可夫模型
- 文献传递
- 双模态语音识别中乘积HMM权重系数与瞬时SNR的关系研究
- 2009年
- 在有噪声污染等复杂情况下,为了能够得到更高的语音识别率,提出了一种新的乘积隐马尔可夫模型(HMM)用于双模态语音识别,研究并确定了模型中权重系数与瞬时信噪比(SNR)之间的关系。该模型在独立训练音频和视频HMM的基础上,建立二维训练模型,并使用重估策略保证更高的准确性。同时引入广义几率递减(GPD)算法,调整音视频特征的权重系数。实验结果表明,提出的方法在噪声环境下体现出了良好稳定的识别性能。
- 赵晖顾亚强唐朝京
- 一种语音信号端点检测的改进方法被引量:14
- 2010年
- 在研究传统的语音端点检测方法的基础上,为提高语言识别率和准确性,提出了一种新的利用对短时能零和过零率的进行差分的方法来求取语音的起始点,达到了语音端点检测的目的。利用语音段和无声段的边界差异性,运用差分的方法找到语音段的起点和末点,避免了对语音段本身的判定过程,增强了抗噪性能也降低了计算复杂度。通过仿真实验结果可以证明,上述方法优于传统语音端点检测方法。
- 顾亚强赵晖吴波
- 关键词:语音端点检测过零率
- 基于综合灰度共生矩阵的显微细胞图像纹理研究被引量:18
- 2004年
- 灰度共生矩阵法是图像纹理分析中一种十分重要的方法。由于受到方向性和细胞本身特性的影响 ,传统的灰度共生矩阵法不能完整描述显微细胞图像的纹理 ,运用综合灰度共生矩阵可以有效地解决这个问题。根据显微细胞图像特点 ,计算出 6个由综合灰度共生矩阵导出的纹理特征参数 ,并对它们进行归一化处理。通过分析这些归一化纹理特征值 。
- 赵晖鲍莉梁光明张耀东
- 关键词:细胞图像纹理特征
- 显微细胞图像的识别方法研究被引量:9
- 2005年
- 提出了一种自动识别显微细胞的方案。该方案首先采用二维阈值化和Canny算子分割方法对图像进行分割,并采用遗传算法将所得结果加以融合。分割之后,对每个细胞进行二值化处理,然后利用一种改进的区域增长法求出二值图像中黑色区域和白色区域的三个区域特征。最后用这些特征值训练BP神经网络,并使用训练好的神经网络来识别未知细胞。
- 张志民赵晖
- 关键词:显微细胞图像
- 彩色人脸图像中的唇部区域定位方法
- 本发明提供一种彩色人脸图像中的唇部区域定位方法,技术方案包含两个步骤:唇部区域粗定位阶段和唇部区域精确定位阶段。在唇部区域粗定位阶段,将输入的彩色人脸图像利用平行线投影分割技术和肤色检测技术同时进行两种处理,并把得到的结...
- 唐朝京张权赵晖刘俭刘星彤李皓
- 一种唇部自动跟踪及检测系统的设计与实现
- 本文设计、实现了一个唇部自动跟踪及检测系统,其在多媒体信号处理、语料库建立及唇读等系统中有重要应用。系统分为三个模块:跟踪、检测和轮廓提取。跟踪模块中,在MeanShift算法基础上设计一个初始化唇部搜索窗的方法;检测模...
- 李皓赵晖张权唐朝京
- 关键词:多媒体信号处理MEANSHIFTC-V模型
- 文献传递