公共文化服务平台

余国先: 作品数：17 被引量：62H指数：5; 供职机构：西南大学计算机与信息科学学院更多>>; 发文基金：国家自然科学基金中央高校基本科研业务费专项资金广东省自然科学基金更多>>; 相关领域：自动化与计算机技术生物学文化科学政治法律更多>>

合作作者

基于网络约束双聚类的癌症亚型分类被引量：5: 2019年; 癌症亚型识别在肿瘤异质性分析中具有重要意义.双聚类可以在大规模基因表达数据的基因和样本维度上同时进行聚类分析,发现部分样本在部分基因子集上表达相似的双聚类簇,进而发现相应的癌症亚型,为癌症的精准基因治疗等提供了重要的信息.双聚类算法通过结合基因相互作用网络数据,可进一步提高癌症亚型分类的准确度,但已有整合基因网络的双聚类算法通常仅基于基因的度加权选择基因,易受网络中噪声互作的干扰和缺失互作的误导.为此,该文提出了一种基于基因互作网络正则化的双聚类算法(Network Regularized Bi-Clustering algorithm, NetRBC). NetRBC首先通过最小化聚类簇上的均方残差分别求取癌症基因表达数据矩阵上的基因簇和样本簇指示矩阵;然后利用基因网络和基因簇指示矩阵构建图正则项;最后将此正则项结合到基于均方残差的非负矩阵分解中,约束基因簇和样本簇矩阵的协同分解,以期提高癌症亚型分类的精度.在多个癌症基因表达数据上的实验结果表明,NetRBC比已有相关方法能够更准确地区分癌症亚型.; 王星王峻余国先余国先; 关键词：非负矩阵分解基因网络

基于降维的蛋白质不相关功能预测被引量：3: 2017年; 蛋白质是生命活动的重要物质基础,对其功能的准确标注可以极大地促进生命科学的研究与发展.已有的蛋白质功能预测方法通常仅关注利用蛋白质具有某些功能的信息(正样例),并没有关注利用蛋白质不相关的功能信息(负样例).已有研究表明,结合蛋白质负样例可以降低蛋白质功能预测的复杂度并提高预测精度.本文提出一种基于降维的蛋白质不相关功能预测方法 (predicting irrelevant functions of proteins based on dimensionality reduction,IFDR).IFDR通过在蛋白质互作网邻接矩阵和蛋白质–功能标记关联矩阵上分别进行随机游走,挖掘蛋白质之间的内在关系和预估蛋白质的缺失功能标记,再分别利用奇异值分解将上述2个矩阵投影降维为低维实数矩阵,最后利用半监督回归预测负样例.在酵母菌、人类和拟南芥的蛋白质数据集上的实验表明,IFDR比已有相关算法能够更准确地预测负样例,对互作网络和功能标记空间的降维均可以提高负样例预测精度.; 余国先傅广垣王峻郭茂祖; 关键词：蛋白质功能预测降维

高维数据上的半监督学习研究: 随着信息技术的快速发展，各个行业收集到的数据越来越多，如何有效地从这些数据中挖掘出有帮助作用的信息，可以极大地促进这些行业的发展。机器学习是数据挖掘、知识发现的基础之一，它是当前及未来计算机科学中的一个热点方向。传统的机...; 余国先; 关键词：半监督学习高维数据多标记学习

基于正负样例的蛋白质功能预测被引量：5: 2016年; 蛋白质功能预测是后基因组时代生物信息学的核心问题之一.蛋白质功能标记数据库通常仅提供蛋白质具有某个功能(正样例)的信息,极少提供蛋白质不具有某个功能(负样例)的信息.当前的蛋白质功能预测方法通常仅利用蛋白质正样例,极少关注量少但富含信息的蛋白质负样例.为此,提出一种基于正负样例的蛋白质功能预测方法(protein function prediction using positive and negative examples,ProPN).ProPN首先通过构造一个有向符号混合图描述已知的蛋白质与功能标记的正负关联信息、蛋白质之间的互作信息和功能标记间的关联关系,再通过符号混合图上的标签传播算法预测蛋白质功能.在酵母菌、老鼠和人类蛋白质数据集上的实验表明,ProPN不仅在预测已知部分功能标记蛋白质的负样例任务上优于现有算法,在预测功能标记完全未知蛋白质的功能任务上也获得了较其他相关方法更高的精度.; 傅广垣余国先王峻郭茂祖; 关键词：蛋白质功能预测

基于标记与特征依赖最大化的弱标记集成分类被引量：3: 2017年; 弱标记学习是多标记学习的一个重要分支,近几年已被广泛研究并被应用于多标记样本的缺失标记补全和预测等问题.然而,针对特征集合较大、更容易拥有多个语义标记和出现标记缺失的高维数据问题,现有弱标记学习方法普遍易受这类数据包含的噪声和冗余特征的干扰.为了对高维多标记数据进行准确的分类,提出了一种基于标记与特征依赖最大化的弱标记集成分类方法 En WL.En WL首先在高维数据的特征空间多次利用近邻传播聚类方法,每次选择聚类中心构成具有代表性的特征子集,降低噪声和冗余特征的干扰;再在每个特征子集上训练一个基于标记与特征依赖最大化的半监督多标记分类器;最后,通过投票集成这些分类器实现多标记分类.在多种高维数据集上的实验结果表明,En WL在多种评价度量上的预测性能均优于已有相关方法.; 谭桥宇余国先王峻郭茂祖; 关键词：高维数据特征子集

基于多网络数据协同矩阵分解预测蛋白质功能被引量：1: 2017年; 准确预测蛋白质功能是生物信息学的核心任务之一,也是人工智能在生物数据分析中的重要应用点之一.高通量技术的广泛应用产生了大量的生物分子功能关联网络,整合这些网络可更为全面地分析理解蛋白质功能机理,提升蛋白质功能预测精度.已有多种基于数据整合的蛋白质功能预测方法,但它们通常难以应用到较大功能标签空间,未利用标签间关联性和差异性整合多个网络.提出一种基于多网络数据协同矩阵分解的蛋白质功能预测方法(ProCMF).该方法首先利用非负矩阵分解将蛋白质-功能标签关联矩阵分解为2个低秩矩阵,挖掘蛋白质与标签之间的潜在关联.其次,为利用标签间关联关系和多种蛋白质特征数据,ProCMF分别基于上述2个低秩矩阵定义平滑正则性,约束指导低秩矩阵的协同分解.为了差异性地集成多个网络,ProCMF对不同的网络设置不同的权重.最后ProCMF将上述目标统一到一个目标方程中,并用一种交替迭代的方法分别优化求解低秩矩阵和网络权重.在酵母菌、人类和老鼠3个模式物种的多网络数据集上的实验结果表明:ProCMF获得了较其他相关算法更好的预测性能,ProCMF能有效地处理大量的功能标签和区分性地整合多个网络.; 余国先王可尧傅广垣王峻曾安; 关键词：蛋白质功能预测网络集成非负矩阵分解

我国地方大数据政策的扩散模式与转移特征研究被引量：13: 2019年; 为揭示我国地方大数据政策的发展趋势与内容关联性,基于政策扩散与政策转移理论,采用内容分析法、社会网络分析方法,探索我国各省市68条地方大数据政策的时空扩散模式与内容转移特征。研究发现:我国地方大数据政策发布与参照的时间扩散模式均符合政策扩散一般规律,时间扩散曲线呈S型;政策参照扩散模式为目前中国常见的"中央—地方扩散"与自上而下层级参照扩散模式;此外,地方大数据政策对重要国家政策内容的继承性较高,不同区域政策内容的创新各具特色。; 丁文姚张自力余国先韩毅

一种增强的局部保持投影方法被引量：3: 2010年; 维数灾难是机器学习算法在高维数据上学习经常遇到的难题,基于局部保持的投影方法(Locality Preserving Projection,LPP),可以很好地解决维数灾难难题。然而传统LPP的相似性度量方法对噪音敏感,为此利用鲁棒路径相似的度量方法,提出一种增强的局部保持投影方法。在高维流形数据上的降维实验证实了该方法对噪声和离群点的有效性。; 马千驰余国先钟鸿鹏; 关键词：维数灾难特征抽取鲁棒性

基于集成图的保局投影算法: 2010年; 为了克服保局投影方法(locality preserving projection,LPP)对噪音敏感,有效性依赖于近邻图构造等缺点,提出一种基于集成图的保局投影方法(graphs ensemble based LPP,GELPP)。该方法先根据鲁棒统计原理定义出对噪声鲁棒的样本间相似性度量,再以该度量为基础构造多个近似的最大生成树;然后利用集成学习泛化能力强的优点来组合多个树为一个集成图;最后通过替换LPP的近邻图和相似性度量来进行保局投影。在高维人脸图像上的降维实验结果表明,该方法对噪声鲁棒,以及在集成图上降维的有效性。; 胡强余国先; 关键词：保局投影降维噪声

基于0-1矩阵分解的蛋白质功能预测被引量：1: 2019年; 准确地标注蛋白质功能是功能基因组学的核心任务之一.蛋白质功能标注信息存在大量缺失且功能标签空间巨大.近期一些标签压缩方法被提出并应用于蛋白质功能预测,但是这些方法获取的压缩标签可解释性差,且面临着多标记学习中的阈值划分难题.为解决这些问题,本文提出一种基于0-1矩阵分解的蛋白质功能预测方法 (zero-one matrix factorization, ZOMF). ZOMF首先将蛋白质–功能标签关联矩阵分解成两个低秩0-1矩阵,挖掘蛋白质和功能标签间的内在关联.其次它利用蛋白质互作网和基因本体结构信息分别针对上述两个低秩矩阵定义了平滑正则项,约束指导低秩矩阵的优化.最后它利用优化获取的低秩矩阵重构关联矩阵,进而实现蛋白质功能预测.通过在酵母菌、拟南芥、老鼠和人类数据集上的实验表明, ZOMF比已有的相关算法能够更准确地预测蛋白质功能,它无需对重构的关联矩阵进行阈值划分,压缩的0-1标签可解释性更直观.; 赵颖闻王峻郭茂祖张自力余国先; 关键词：蛋白质功能预测矩阵分解基因本体

余国先

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

余国先

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈