陶蔚
- 作品数:5 被引量:13H指数:3
- 供职机构:中国人民解放军理工大学更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 加密数据检测方法和系统
- 本发明提供了一种加密数据检测方法和系统。所述检测方法包括:判断输入的数据的协议是否为已知协议;对所述输入的数据中判断为未知协议的数据进行多种随机性测试,得到所述未知协议的数据分别与所述多种随机性测试对应的多个随机性特征;...
- 潘志松周宇欢张艳艳孟娟陶蔚
- 文献传递
- 一种利用Screening加速技巧的Lasso算法
- 2018年
- Lasso(Least absolute shrinkage and selection operator)是目前广为应用的一种稀疏特征选择算法。经典的Lasso算法通过对高维数据进行特征选择一定程度上降低了计算开销,然而,求解Lasso问题目前仍面临诸多困难与挑战,例如当特征维数和样本数量非常大时,甚至无法将数据矩阵加载到主存储器中。为了应对这一挑战,Screening加速技巧成为近年来研究的热点。Screening可以在问题优化求解之前将稀疏优化结果中系数必然为0的无效特征筛选出来并剔除,从而极大地降低数据维度,在不损失问题求解精度的前提下,加速稀疏优化问题的求解速度。首先推导了Lasso的对偶问题,根据对偶问题的特性得出基于对偶多面投影的Screening加速技巧,最后将Screening加速技巧引入Lasso特征选择算法,并在多个高维数据集上进行实验,通过加速比、识别率以及算法运行时间三个指标验证了Screening加速技巧在Lasso算法上的良好性能。
- 邱俊洋潘志松易磊陶蔚张梁梁
- 关键词:高维数据
- 线性插值投影次梯度方法的最优个体收敛速率被引量:5
- 2017年
- 投影次梯度算法(projected subgradient method,PSM)是求解非光滑约束优化问题最简单的一阶梯度方法,目前只是对所有迭代进行加权平均的输出方式得到最优收敛速率,其个体收敛速率问题甚至作为open问题被提及.最近,Nesterov和Shikhman在对偶平均方法(dual averaging method,DAM)的迭代中嵌入一种线性插值操作,得到一种拟单调的求解非光滑问题的次梯度方法,并证明了在一般凸情形下具有个体最优收敛速率,但其讨论仅限于对偶平均方法.通过使用相同技巧,提出了一种嵌入线性插值操作的投影次梯度方法,与线性插值对偶平均方法不同的是,所提方法还对投影次梯度方法本身进行了适当的修改以确保个体收敛性.同时证明了该方法在一般凸情形下可以获得个体最优收敛速率,并进一步将所获结论推广至随机方法情形.实验验证了理论分析的正确性以及所提算法在保持实时稳定性方面的良好性能.
- 陶蔚潘志松朱小辉陶卿
- 在线多任务学习的骨干网网络流量分类研究被引量:3
- 2018年
- 网络流量分类是机器学习与网络安全领域中的一个研究热点.针对高速骨干网上网络流量的高速性与演化特性,基于在线稀疏学习算法FTPRL,提出一种在线多任务特征选择学习算法-MT-FTPRL.使用了Per-Coordinate学习率,对每个特征的学习率分别考虑,与全局学习率相比更具优势;提出一个在线多任务学习的网络流量分类框架,通过多个网络流之间的信息共享,提取一组拥有良好判别能力的共同特征子集;在实验部分构造了一个基于真实的骨干网网络流量的MAWI数据集,并通过对比实验对提出的算法及分类框架进行验证.实验表明,算法有着满意的分类准确性和检测效率,且能在多个网络流中提取一组共同的特征子集,提高分类系统的鲁棒性,更适应网络流量动态演化的特点.
- 易磊潘志松陶蔚杨海民
- 关键词:多任务学习骨干网网络流量分类
- 机器学习随机优化方法的个体收敛性研究综述被引量:6
- 2017年
- 随机优化方法是求解大规模机器学习问题的主流方法,其研究的焦点问题是算法是否达到最优收敛速率与能否保证学习问题的结构。目前,正则化损失函数问题已得到了众多形式的随机优化算法,但绝大多数只是对迭代进行平均的输出方式讨论了收敛速率,甚至无法保证最为典型的稀疏结构。与之不同的是,个体解能很好保持稀疏性,其最优收敛速率已经作为open问题被广泛探索。另外,随机优化普遍采用的梯度无偏假设往往不成立,加速方法收敛界中的偏差在有偏情形下会随迭代累积,从而无法应用。本文对一阶随机梯度方法的研究现状及存在的问题进行综述,其中包括个体收敛速率、梯度有偏情形以及非凸优化问题,并在此基础上指出了一些值得研究的问题。
- 陶卿马坡张梦晗陶蔚