国家自然科学基金(61170019)
- 作品数:21 被引量:56H指数:6
- 相关作者:廖士中丁立中冯昌王梅刘惊雷更多>>
- 相关机构:天津大学东北石油大学烟台大学更多>>
- 发文基金:国家自然科学基金天津市自然科学基金天津市应用基础与前沿技术研究计划更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 正定矩阵支持向量机正则化路径算法被引量:7
- 2013年
- 正则化路径算法是数值求解支持向量机(support vector machine,SVM)分类问题的有效方法,它可在相当于一次SVM求解的时间复杂度内得到所有的正则化参数及对应SVM的解.现有的SVM正则化路径算法或者不能处理具有重复数据、近似数据或线性相关数据,或者计算开销较大.针对这些问题,应用正定矩阵方程组求解方法来求解SVM正则化路径,提出正定矩阵SVM正则化路径算法(positive definite SVM path,PDSVMP).PDSVMP算法将迭代方程组的系数矩阵转换为正定矩阵,并采用Cholesky分解方法求解路径上各拐点处Lagrange乘子增量向量;与已有算法中直接求解正则化参数不同,该算法根据活动集变化情况确定参数增量,并在此基础上计算正则化参数,这样保证了理论正确性和数值稳定性,并可降低计算复杂性.实例数据集及标准数据集上的实验表明,PDSVMP算法可正确处理包含重复数据、近似数据或线性相关数据的数据集,并具有较高的计算效率.
- 廖士中王梅赵志辉
- 关键词:支持向量机正定矩阵CHOLESKY分解
- 基于多源共享因子的多张量填充
- 2016年
- 张量填充在数据挖掘、机器学习、生物信号处理等领域有着广泛的应用.现有的张量填充方法多在低秩假设的前提下对单独的张量进行填充,然而由于张量数据的复杂结构,张量填充的精度通常较低.为此,研究不同来源多个张量同时填充的方法.首先,利用Tucker分解将多源张量填充问题转换为最小二乘问题.然后,假设不同来源的张量在共享模式上具有共同的信息,为Tucker分解构造共享的因子矩阵集,提取多源张量在共享模式上的共同潜在结构,进而建立基于共享因子的多源张量填充(SF-MTC)方法.最后,利用非线性共轭梯度法和奇异值分解(SVD)快速求解Tucker分解的因子矩阵集及核心张量,完成同时对多个张量的填充,并进一步分析了SF-MTC的计算复杂度.在人工及实际数据集上的实验结果表明,所提出的SF-MTC能提高张量填充的求解效率,并在具有相关性的多源张量数据集上得到更高的填充精度.
- 张骁胡清华廖士中
- 关键词:非线性共轭梯度法奇异值分解
- 一类分数阶微分方程边值问题解的存在性
- 2018年
- 研究一类分数阶微分方程边值问题,其非线性项包含未知函数的Riemman-Liouville分数阶导数.利用格林函数的性质和单调迭代的方法得到该边值问题存在2个解的充分性条件,构造迭代序列来逼近这2个解,并举例说明了结果的有效性.
- 冯立杰
- 关键词:分数阶微分方程边值问题单调迭代
- 矩优化Boosting算法被引量:1
- 2015年
- 间隔分布是Boosting算法的关键,现有的间隔分布泛化误差界难以计算,限制Boosting算法的发展.基于此问题,文中提出直接优化间隔分布的矩优化Boosting算法(MOBoost).首先,推导基于间隔分布一阶矩和二阶矩的Boosting泛化误差界(Boosting的矩泛化界),直接刻画间隔分布对Boosting的影响.然后,依据Boosting的矩泛化界,给出Boosting的矩准则,在最大化间隔分布的一阶矩同时最小化间隔分布的二阶矩.最后,给出求解Boosting的矩准则凸二次优化问题的原始形式和对偶形式,为Boosting矩准则提供有效的计算方法.理论分析与实验表明,MOBoost有效可靠.
- 刘川廖士中
- 关键词:BOOSTING泛化误差
- CP-nets的完备性及一致性研究被引量:7
- 2012年
- CP-nets是一种简单而又直观的图形化偏好表示工具,成为近几年人工智能的一个研究热点.然而,任意二值CP-nets上的强占优算法还没有给出,CP-nets可表示的偏好的完备性还无人研究,CP-nets所能表示的偏好是否一致也还未彻底解决.基于CP-nets上的强占优运算研究CP-nets的完备性和一致性.首先,通过构造CP-nets导出图及其性质的研究,得出强占优的本质是求取翻转关系的传递闭包,从而利用Warshall算法求出可判断任意CP-nets的强占优;其次,通过求取3种不同结构(可分离的、链表结构和树形结构)的CP-nets的偏好个数,给出了CP-nets可表达的偏好的不完备性定理,并给出了可分离的CP-nets中偏好的计数公式;最后,研究CP-nets的一致性,给出了CP-nets的一致性判定定理及其算法.所做工作不仅解决了Boutilier和Goldsmith提出的一些难题,还深化了CP-nets的基础理论研究.
- 刘惊雷廖士中张伟
- 正则化路径上三步式SVM贝叶斯组合被引量:1
- 2013年
- 模型组合旨在整合并利用假设空间中多个模型提高学习系统的稳定性和泛化性.针对支持向量机(support vector machine,SVM)模型组合多采用基于样本采样方法构造候选模型集的现状,研究基于正则化路径的SVM模型组合.首先证明SVM模型组合Lh-风险一致性,给出SVM模型组合基于样本的合理性解释.然后提出正则化路径上的三步式SVM贝叶斯组合方法.利用SVM正则化路径分段线性性质构建初始模型集,并应用平均广义近似交叉验证(generalized approximate cross-validation,GACV)模型集修剪策略获得候选模型集.测试或预测阶段,应用最小近邻法确定输入敏感的最终组合模型集,并实现贝叶斯组合预测.与基于样本采样方法不同,三步式SVM贝叶斯组合方法基于正则化路径在整个样本集上构造模型集,训练过程易于实现,计算效率较高.模型集修剪策略可减小模型集规模,提高计算效率和预测性能.实验结果验证了正则化路径上三步式SVM模型组合的有效性.
- 王梅廖士中
- 关键词:模型组合支持向量机一致性
- 小样本贝叶斯网络参数学习方法被引量:9
- 2016年
- 当训练数据充分时,极大似然估计方法是贝叶斯网络参数学习典型且有效的方法。但当训练数据量少且领域知识缺乏时,极大似然估计往往无法给出一致无偏的参数估计。为此,提出一种新的贝叶斯网络参数学习方法TL-WMLE。将极大似然估计方法与迁移学习理论、样本不均衡方法相结合,解决数据量过少、领域知识缺乏时的贝叶斯网络参数学习问题。使用SMOTE-N方法构建辅助分类器,并依据协变量偏移理论,利用辅助分类器的分类结果来计算源域数据权值。采用赋权的源域数据和目标域数据构造目标域的似然函数,应用该似然函数对目标域的参数进行极大似然估计。实验结果表明,在小样本情况下,该方法的分类精度优于极大似然估计方法。
- 李子达廖士中
- 关键词:贝叶斯网络小样本目标域
- 一类非线性分数阶微分方程边值问题正解的存在性被引量:1
- 2018年
- 研究一类非线性分数阶微分方程边值问题,通过计算得到相应问题的格林函数,在此基础上,进一步分析格林函数的性质.运用锥上的Krasnosel'skii's不动点定理,证明了该边值问题至少存在一个正解,最后举例说明了此类方程边值问题正解的存在性.
- 宋景红
- 关键词:分数阶微分方程不动点定理边值问题正解
- 一种大规模支持向量机的高效求解算法被引量:1
- 2015年
- 现有大规模支持向量机求解算法需要大量的内存资源和训练时间,通常在大集群并行环境下才能实现。提出了一种大规模支持向量机(SVM)的高效求解算法,以在个人PC机求解大规模SVM。它包括3个步骤:首先对大规模样本进行子采样来降低数据规模;然后应用随机傅里叶映射显式地构造随机特征空间,使得可在该随机特征空间中应用线性SVM来一致逼近高斯核SVM;最后给出线性SVM在多核环境下的并行实现方法以进一步提高求解效率。标准数据集的对比实验验证了该求解算法的可行性与高效性。
- 冯昌李子达廖士中
- 关键词:子采样
- 基于近似高斯核显式描述的大规模SVM求解被引量:4
- 2014年
- 大规模数据集上非线性支持向量机(support vector machine,SVM)的求解代价过高,然而对于线性SVM却存在高效求解算法.为了应用线性SVM高效求解算法求解非线性SVM,并保证非线性SVM的精确性,提出一种基于近似高斯核显式描述的大规模SVM求解方法.首先,定义近似高斯核并建立其与高斯核的关系,推导近似高斯核与高斯核的偏差上界.然后给出近似高斯核对应的再生核希尔伯特空间(reproducing kernel Hilbert space,RKHS)的显式描述,由此可精确刻画SVM解的结构,增强SVM方法的可解释性.最后显式地构造近似高斯核对应的特征映射,并将其作为线性SVM的输入,从而实现了用线性SVM算法高效求解大规模非线性SVM.实验结果表明,所提出的方法能提高非线性SVM的求解效率,并得到与标准非线性SVM相近的精确性.
- 刘勇江沙里廖士中
- 关键词:支持向量机线性支持向量机核方法再生核希尔伯特空间