刘泽宇
- 作品数:6 被引量:85H指数:4
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金青海省自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于卷积降噪自编码器的藏文历史文献版面分析方法被引量:12
- 2018年
- 近年来,随着人们对历史和传统文化的保护和传承越来越重视,研究人员对历史文献数字化的兴趣也越来越高涨。版面分析是历史文献数字化的重要基础步骤,该文提出了一种基于卷积降噪自编码器的藏文历史文献版面分析方法。首先,将藏文历史文献图像进行超像素聚类获得超像素块;然后,利用卷积降噪自编码器提取超像素块的特征;最后,使用SVM分类器对藏文历史文献的超像素块进行分类预测,从而提取出藏文历史文献版面的各个部分。在藏文历史文献数据集上的实验表明,该方法能够对藏文历史文献的不同版面元素进行有效的分离。
- 张西群马龙龙段立娟刘泽宇吴健
- 关键词:版面分析
- 两两关系马尔科夫网的自适应组稀疏化学习
- 2015年
- 稀疏化学习能显著降低无向图模型的参数学习与结构学习的复杂性,有效地处理无向图模型的学习问题.两两关系马尔科夫网在多值变量情况下,每条边具有多个参数,本文对此给出边参数向量的组稀疏化学习,提出自适应组稀疏化,根据参数向量的模大小自适应调整惩罚程度.本文不仅对比了不同边势情况下的稀疏化学习性能,为了加速模型在复杂网络中的训练过程,还对目标函数进行伪似然近似、平均场自由能近似和Bethe自由能近似.本文还给出自适应组稀疏化目标函数分别使用谱投影梯度算法和投影拟牛顿算法时的最优解,并对比了两种优化算法进行稀疏化学习的性能.实验表明自适应组稀疏化具有良好的性能.
- 刘建伟任正平刘泽宇黎海恩罗雄麟
- 正则化稀疏模型被引量:62
- 2015年
- 正则化稀疏模型在机器学习和图像处理等领域发挥着越来越重要的作用,它具有变量选择功能,可以解决建模中的过拟合等问题.Tibshirani提出的Lasso使得正则化稀疏模型真正开始流行.文中总结了各种正则化稀疏模型,指出了各个稀疏模型被提出的原因、所具有的优点、适宜解决的问题及其模型的具体形式.最后,文中还指出了正则化稀疏模型未来的研究方向.
- 刘建伟崔立鹏刘泽宇罗雄麟
- 关键词:正则化无偏估计
- 核典型关联性分析相关特征提取与核逻辑斯蒂回归域自适应学习被引量:5
- 2016年
- 本文提出了一种利用核典型关联性分析提取源域目标域最大相关特征,使用核逻辑斯蒂回归模型进行域自适应学习的算法,该算法称为KCCA-DAML(Kernel Canonical Correlation Analysis for Domain Adaptation Learning).该算法基于特征集关联性分析,有效的减小源域和目标域的概率分布差异性,利用提取的最大相关特征通过核逻辑斯蒂回归模型实现源域到目标域的跨域学习.实验比较源域数据上核逻辑斯蒂学习模型、目标域上核逻辑斯蒂学习模型、源域和目标域上核逻辑斯蒂学习模型和KCCA-DAML模型,结果显示KCCA-DAML在真实数据集上成功的实现了跨域学习.
- 刘建伟孙正康刘泽宇罗雄麟
- 关键词:正则化模型
- 基于多模态神经网络的图像中文摘要生成方法
- 图像的自然语言描述(Image Caption)是一个融合计算机视觉、自然语言处理和机器学习的跨领域课题.它作为多模态信息处理的关键技术,近年来取得了显著成果.当前研究大多针对图像生成英文摘要,而对于中文摘要的生成方法研...
- 刘泽宇马龙龙吴健孙乐
- 关键词:神经网络
- 基于多模态神经网络的图像中文摘要生成方法被引量:6
- 2017年
- 图像的自然语言描述(image captioning)是一个融合计算机视觉、自然语言处理和机器学习的跨领域课题。它作为多模态处理的关键技术,近年来取得了显著成果。当前研究大多针对图像生成英文摘要,而对于中文摘要的生成方法研究较少。该文提出了一种基于多模态神经网络的图像中文摘要生成方法。该方法由编码器和解码器组成,编码器基于卷积神经网络,包括单标签视觉特征提取网络和多标签关键词特征预测网络,解码器基于长短时记忆网络,由多模态摘要生成网络构成。在解码过程中,该文针对长短时记忆网络的特点提出了四种多模态摘要生成方法 CNIC-X、CNIC-H、CNIC-C和CNIC-HC。在中文摘要数据集Flickr8k-CN上实验,结果表明该文提出的方法优于现有的中文摘要生成模型。
- 刘泽宇马龙龙马龙龙吴健
- 关键词:神经网络