国家自然科学基金(60602017) 作品数:10 被引量:7 H指数:1 相关作者: 张巍 魏志强 李娜 李琳琳 吴晓如 更多>> 相关机构: 中国海洋大学 安徽科大讯飞信息科技股份有限公司 中国科学技术大学 更多>> 发文基金: 国家自然科学基金 山东省优秀中青年科学家科研奖励基金 山东省科技攻关计划 更多>> 相关领域: 自动化与计算机技术 电子电信 建筑科学 轻工技术与工程 更多>>
自适应AVS_M分数像素运动估计快速算法 被引量:1 2008年 为了减小分数像素运动估计的计算量,提出了一种适用于AVS_M的分数像素快速搜索算法。该算法采用更多的预测矢量提高分数预测矢量的准确性;在分数预测矢量不够准确时,利用自适应阈值的判断跳过不必要搜索过程,或者利用分析分数像素候选点的匹配误差关系排除可能性小的点。实验分析表明:对于不同运动特征的视频序列,该算法在保证图像质量和编码效率基本不变的同时,节省了61.88%~87.06%计算量。 魏志强 李翠苹 刘敏 王岩 王莉关键词:视频编码 基于SVM的汉语决策式依存分析 2010年 决策式分析有着贪婪的特性,容易引起错误增殖。针对该问题,提出一种基于SVM的汉语决策式依存分析算法。利用SVM构建根查找器,用根结点将句子划分为2个子句。从子句中识别出介词短语,采用改进后的Nivre算法分析子句。该算法在分析句子之前做预处理从而降低句子复杂度,减少错误增殖,分析准确率也相应得到提高。实验结果表明,该分析策略的准确率比Nivre算法提高了3.38%。 姚文琳 王玉丹关键词:依存分析 介词短语 基于多高斯建模和挑选的HMM语音合成系统 本文介绍了一种基于多高斯建模和挑选的HMM语音合成方法。该方法的目的是通过多高斯建模和合成使得合成语音听上去音色更亮,更具多样性,音质更好。该方法在模型训练阶段使用高斯混和模型来表征用于合成的HMM声学模型中每个状态的观... 卢恒 张巍 凌震华 王仁华 戴礼荣关键词:语音合成 文献传递 数字城市中矩形建筑物区域的自动获取 被引量:2 2009年 为了缩小基于视频的数字城市三维重建中建筑物特征点的提取匹配的搜索范围,需要对目标建筑物区域进行快速提取。以矩形建筑物为例,首先对预处理后的图像做Hough变换,获取直线段集合;然后,在分析建筑物轮廓线的相互位置关系时,利用提出的点密度和Hough空间中计数器的数值,筛选出直线段集合中能表现建筑物轮廓信息的直线段。实验结果表明,运用点密度能去除干扰线段,算法对建筑物上下轮廓和左右轮廓采用不同的提取策略,在由于拍摄角度而造成的建筑物畸变的情况下,能快速准确地提取出矩形建筑物区域。 魏志强 孙亚兵 纪筱鹏 杨淼关键词:建筑物提取 HOUGH变换 自适应阈值 语音库裁剪的一种不定长递阶聚类方法 被引量:1 2007年 大量使用不定长是大语料库语音合成质量的一个重要保证,而语音库裁剪方法通常会导致不定长的损失.针对这一关键性问题,该文构建了NuClustering-VPA算法:对不同粒度的不定长变体进行聚类,根据高阶聚类结果调整低阶变体的聚类,使得低阶聚类中心有所偏向.NuClustering-VPA算法保留了最重要的不定长,从而有效减小了裁剪对不定长的破坏.测听实验表明,利用NuClustering-VPA算法,即使在语音库裁减率为39.63%时,合成自然度下降较小,仍然保持在较高的水平.这一技术已被应用在科大讯飞公司的实际语音产品中. 张巍 吴晓如 刘江 王仁华用户反馈自适应的POP3邮件过滤代理模型 被引量:1 2009年 为了有效接受邮件客户端反馈并自动根据邮件客户端反馈对邮件过滤系统做出调整,提出了用户反馈自适应的POP3邮件过滤代理模型SAMFUF(self-adaptive mail filtering POP3 proxy based on users’feedback).SAMFUF采用异步连接模拟同步连接方式建立邮件客户端和邮件服务器间POP3连接,实现了邮件客户端与邮件服务器间的透明性连接;将最大熵、贝叶斯和支持向量机等基于内容过滤的方法从邮件过滤系统中独立出来,实现了通用邮件过滤系统的设计;通过在邮件中插入包含邮件唯一标识、分类结果等信息的HTML表单的标签以及调整邮件过滤模型,实现了基于邮件客户端的用户反馈以及邮件过滤系统的自适应功能;采用线程池管理线程和overlapped I/O事件通信方式实现邮件客户端与邮件服务器间通信,实现了邮件过滤服务的高效率和稳定性.实验表明,SAMFUF在垃圾邮件过滤上具有较高的效率和准确率. 张巍 逄仁波 庞彦伟 曲海鹏关键词:电子邮件 POP3 反垃圾邮件 邮件过滤 一种基于Co-Training的海洋文献分类方法 被引量:1 2010年 使用有监督机器学习方法进行海洋文献的分类往往存在人工标注量太大的缺点,针对这个问题,提出利用半监督机器学习中的协同训练(Co-training)方法来实现减小人工标注量的目标。该方法从2个View分别训练不同的分类器,在此基础上,根据少量有标注文档从大量无标注文档中获取有用信息,通过协同训练来提升2个分类器的性能,并训练出最终分类模型。实验结果表明,在人工标注仅2篇文献的条件下,该方法最终的分类性能十分接近需人工标注1 500多篇文献的有监督分类器。这说明将Co-training方法应用于海洋文献分类可以大大减小人工标注量,并有着较为良好的分类性能。 徐建良 姜亦宏 张巍 王秋红关键词:海洋文献 文本分类 半监督学习 基于AVS-M4×4块的快速帧内预测算法 面向移动的视频编码标准 AVS-M 采用空域上9种模式预测和拉格朗日率失真优化(RDO)模型来进行帧内预测模式选择,算法复杂度很高。为此,本文提出一种基于4×4块的帧内预测模式选择快速算法。该算法利用视频序列的时间、空间... 王岩 李翠苹关键词:视频编码 AVS-M 帧内预测 文献传递 基于英语语音重音的自动探测 2013年 韵律特征的生成除了通过人工标注,还可以由声音特征转化为声学韵律特征,再转化为韵律特征得到。以最重要的韵律特征之一—基音重音为例,对基音重音的四种音调进行分类标注。利用最大熵、K-近邻、Adaboost和J48四种算法进行模型训练,并在此基础上实现基于co-training的基音重音韵律自动标注。基于声学参数的韵律标注不再依赖于大量标注语料的训练集,只要准确把握声学参数与韵律特征之间的规则关系,就可以实现极小化的韵律自动标注。对于不同语种的语音合成,可以找到一种方法,实现语音合成的可移植性。 李琳琳 李娜 张志楠关键词:半监督学习 CO-TRAINING 最大熵 麦克风自适应算法在鲁棒语音合成中的应用研究 被引量:1 2013年 随着语音合成技术的迅速发展,如何利用网络上易获取的语音代替高成本的纯净语料库,成为了当下降低语音合成成本的关键问题。然而这些网络语音极有可能包含由未知麦克风变化所带来的噪声或者波动情况。为了解决这个问题,本文针对网络语音麦克风因素多变性所引起的噪声情况进行了分析,并且比较了三种麦克风自适应方法对于降低麦克风噪声因素对合成语音的效果。实验结果表明,对含噪声语音库进行麦克风自适应处理后,其合成语音的自然度有了明显提升。 李娜 李琳琳 王永远