李晓宇
- 作品数:7 被引量:6H指数:1
- 供职机构:南京信息工程大学更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学哲学宗教环境科学与工程更多>>
- 基于坐标下降邻域选择的高斯图模型结构并行估计被引量:1
- 2016年
- 在许多机器学习问题中,往往需要研究高维数据中各个特征之间的统计相关性.稀疏高斯图模型作为解决这一问题的有效方法之一,广泛应用于数据挖掘、生物信息、金融分析等应用问题中.由于模型参数量是数据维度的平方量级,基于高维数据的稀疏高斯图模型的参数估计一直是统计机器学习研究中的挑战性问题之一.提出了一种新颖的基于坐标下降优化的稀疏高斯图模型并行估计算法,其核心思想是根据高斯图模型结构估计等价于每个变量的稀疏近邻选择这一基本结论,采用坐标下降来求解每个近邻选择子问题.通过将样本矩阵进行分布式存储,在MPI(Message-Passing Interface)框架下实现了这些子问题的并行求解.实验结果表明,该算法具有良好的并行运算性能,在保证结构估计精度的同时,能够大幅度提升运算速度.
- 李晓宇周铭袁晓彤罗琦刘青山
- 利用坐标下降实现并行稀疏子空间聚类被引量:5
- 2016年
- 随着数据规模的不断扩大,稀疏子空间聚类问题面临计算上的巨大挑战。现有稀疏子空间聚类算法如交替方向乘子法(ADMM)往往基于串行实现,难以利用多核处理器提高处理大规模聚类问题的效率。针对这个问题,提出一种基于坐标下降的并行稀疏子空间聚类方法。该方法利用稀疏子空间聚类可以建模为求解一系列的样本自稀疏表达子问题的特点,使用坐标下降方法来求解每个子问题,具有参数少、收敛快的优点;同时结合自稀疏表达子问题独立的特点,在处理器的各个核心上同时求解不同样本对应的子问题,因此可以充分利用计算机资源,减少运行时间开销。在模拟数据和运动分割数据集Hopkins-155上与常用的ADMM算法进行对比实验,结果表明该算法在多核处理器上可以显著提升运行速度且聚类精度与ADMM相当。
- 吴杰祺李晓宇袁晓彤刘青山
- 关键词:高维
- 一种高斯图模型结构估计的分布式并行优化方法
- 本发明公开了一种高斯图模型结构估计的分布式并行优化方法,包括:将样本矩阵按列分割成h个子矩阵,分别存储于h个计算节点上;选择一个子矩阵,从中取一列记作Y;将该子矩阵中的剩余列和其它子矩阵构成A;利用分布式坐标下降法对La...
- 袁晓彤刘青山李晓宇
- 文献传递
- 习近平绿色发展理念研究
- 科技发展给人类带来了物质资料的极大丰富,但随之而来的还有自然环境的逐渐恶化,“雾霾”、“沙尘暴”、“泥石流”等极端事件频发,导致人类与自然环境间的关系日趋紧张。习近平绿色发展理念作为新时代下马克思主义中国化的最新成果,是...
- 李晓宇
- 关键词:绿色发展理念生态观
- 利用坐标下降实现并行稀疏子空间聚类
- 本文研究稀疏子空间聚类模型的并行计算问题。稀疏子空间聚类问题可以建模为求解一系列的样本自稀疏表达子问题。我们提出使用坐标下降方法来求解样本自稀疏表达子问题,具有参数少,收敛快的优点。同时结合自稀疏表达子问题独立的特点,设...
- 吴杰祺李晓宇袁晓彤刘青山
- 基于坐标下降邻域选择的高斯图模型结构并行估计
- 在许多机器学习问题中,往往需要研究高维数据中各个特征之间的统计相关性。稀疏高斯图模型作为解决这一问题的有效方法之一,广泛应用于数据挖掘、生物信息、金融分析等应用问题中。由于模型参数量是数据维度的平方量级,基于高维数据的稀...
- 李晓宇袁晓彤罗琦刘青山
- 基于分布式数据的高斯图模型结构并行估计
- 高斯图模型是一种基于高斯分布假设的无向图模型。图中节点表示变量,节点之间的边界表示变量之间的依赖关系。高维和复杂结构数据下的图模型学习是当前图模型研究的热点和难点问题,具有很高的研究和应用价值,广泛应用于统计机器学习、数...
- 李晓宇
- 关键词:分布式算法