您的位置: 专家智库 > >

国家自然科学基金(61170152)

作品数:19 被引量:49H指数:4
相关作者:刘学军张礼吕宏强冯爱民王黎黎更多>>
相关机构:南京航空航天大学南京林业大学更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术航空宇航科学技术医药卫生更多>>

文献类型

  • 19篇中文期刊文章

领域

  • 14篇自动化与计算...
  • 3篇航空宇航科学...
  • 2篇医药卫生

主题

  • 9篇RNA-SE...
  • 8篇基因
  • 5篇基因表达
  • 3篇异构体
  • 3篇翼型
  • 3篇映射
  • 3篇转录
  • 3篇向量
  • 3篇向量机
  • 3篇分析方法
  • 2篇多输出
  • 2篇异基因
  • 2篇翼型设计
  • 2篇支持向量
  • 2篇支持向量机
  • 2篇数据分析
  • 2篇转录组
  • 2篇基因芯片
  • 2篇负二项分布
  • 2篇高斯

机构

  • 19篇南京航空航天...
  • 3篇南京林业大学

作者

  • 16篇刘学军
  • 11篇张礼
  • 3篇吕宏强
  • 3篇冯爱民
  • 2篇王凯莉
  • 2篇苏乐群
  • 2篇王黎黎
  • 2篇张武军
  • 1篇赵加敏
  • 1篇徐亚峰
  • 1篇金鑫
  • 1篇李蒙
  • 1篇谭晓阳
  • 1篇石新新
  • 1篇陈骁
  • 1篇李正浩

传媒

  • 4篇数据采集与处...
  • 2篇南京大学学报...
  • 2篇中国生物医学...
  • 2篇航空计算技术
  • 2篇计算机与现代...
  • 1篇计算机学报
  • 1篇计算机工程与...
  • 1篇空气动力学学...
  • 1篇软件学报
  • 1篇山东大学学报...
  • 1篇中国图象图形...
  • 1篇计算机技术与...

年份

  • 1篇2019
  • 1篇2018
  • 2篇2017
  • 3篇2016
  • 5篇2015
  • 2篇2014
  • 3篇2013
  • 1篇2012
  • 1篇2011
19 条 记 录,以下是 1-10
排序方式:
多实验平台下基因及异构体表达分析综述被引量:1
2017年
转录组学研究近几年成为生命科学和医学领域的研究热点,基因表达水平测量则是转录组学研究的基础。差异基因表达分析对于了解基因功能具有重要作用,而差异异构体表达分析则能够反映选择性剪切变化的情况。当前大规模测量基因表达水平的实验平台主要包括基因芯片,以及基于高通量测序技术的RNA-Seq。首先介绍广泛使用的Affymetrix传统3'基因芯片、外显子芯片、较新的全转录组芯片,以及基于RNA-Seq技术的Illumina平台4个主流实验平台的技术原理;其次从基因表达水平计算和差异表达分析两方面介绍每个平台下一些主流数据分析方法和该研究设计的方法,分析每个平台下各数据分析方法的优劣,并进一步展示在标准数据集上一些代表性方法的对比结果。
王凯莉张礼刘学军
关键词:RNA-SEQ基因表达分析
一种针对RNA-Seq数据的基因异构体表达水平计算方法被引量:3
2013年
RNA-Seq是基于高通量测序技术对转录组进行研究的实验技术,被大量用来进行基因的选择性剪切研究。针对RNA-Seq数据中读段对基因异构体的多源映射以及读段在基因参考序列上呈非均匀分布的问题,基于文本数据分析领域流的LDA(latent dirichlet allocation)模型,提出了一个新的基因异构体表达值计算方法 LDAseq。利用已知的基因异构体注释信息对模型参数进行约束,解决读段对基因异构体的多源映射问题;通过引入固定长度的"探针"将基因参考序列进行分段,解决读段在整个基因参考序列上呈非均匀分布的问题。将LDAseq应用到一个小鼠数据集和一个人类乳腺癌数据集,并和目前流行的方法 Cufflinks和RSEM进行对比。结果表明,所提出的LDAseq方法相比Cufflinks和RSEM准确率分别提高了75.5%和62.8%,从而获得了较为准确的基因异构体表达水平计算结果。
刘学军李蒙张礼
关键词:RNA-SEQLDA
融合多平台表达数据的转录组差异表达分析被引量:3
2018年
差异表达分析是转录组研究的基本目标之一,对揭示基因功能和调控规律以及选择性剪切的波动变化具有重要作用.基因芯片与RNA-Seq是当前主流的测量转录组表达水平的两种实验平台,并被广泛应用于转录组差异表达分析.随着测序技术的发展,测序成本不断降低,许多研究采用多种测量平台以获得更为准确的结果.当前公共数据库中积累了大量的基因芯片和RNA-Seq表达数据,为多平台转录组数据分析提供了研究空间.研究表明:融合多平台表达数据能够提高差异表达分析的准确性和可靠性.大多数现有的融合多平台表达数据的差异检测研究主要对多种类型的基因芯片表达数据进行融合,较少考虑RNA-Seq表达数据.并且现有方法忽略了很多有用的信息,例如测量误差和重复实验产生的波动性.针对现有方法存在的问题,该文提出了融合多平台转录组数据的差异检测模型mpDE(multi-platform Differential Expression model),寻找差异表达的基因和异构体.该模型将不同实验平台的表达数据和表达水平的技术性测量误差融入到模型中,同时考虑了同一平台在不同条件下的生物重复或技术重复的波动性,从而提高差异检测准确度.该文将mpDE应用到两个人类多平台表达数据集进行差异表达检测,涉及了Affymetrix的传统3’芯片、外显子芯片、HTA2.0芯片,RNA-Seq四种常用的转录组表达水平测量平台.该文将mpDE计算结果与单平台的差异检测结果和其他多平台表达数据融合算法进行了对比.实验结果表明,mpDE获得了更为准确的差异检测结果,差异基因检测准确率与以往方法相比提高了2%~8%;差异异构体检测准确率提高了1%~15%.
王凯莉张礼刘学军
关键词:多平台差异表达分析基因芯片RNA-SEQ生物信息学
基于模型选择的差异基因和异构体检测被引量:2
2016年
基因和异构体差异表达分析是获取基因和异构体功能的重要途径,现已成为生物信息学的一个重要领域。RNA-seq是一种高通量测序技术,近年来广泛用于转录组研究。RNA-seq数据的读段多源映射现象给差异异构体检测带来挑战。针对该问题,本文采用先计算基因和异构体的表达水平,再进行差异分析的方法,以计算表达水平的PGseq模型为基础,采用贝叶斯因子方法进行模型选择,提出一个新的差异检测方法 PG_bayes,解决了基因和异构体两方面的差异检测问题。将PG_bayes应用于人类和小鼠共4个真实数据集中,并与目前流行的差异检测方法进行对比。实验结果表明,PG_bayes方法在差异基因和差异异构体检测中具有较高的准确度和灵敏度,并且在差异异构体检测方面表现出优势。
王黎黎刘学军张礼
关键词:RNA-SEQ贝叶斯因子
代价敏感相关向量机
2015年
相关向量机(RVM)是在稀疏贝叶斯框架下提出的稀疏模型,由于其强大的稀疏性和泛化能力,近年来在机器学习领域得到了广泛研究和应用,但和传统的决策树、神经网络算法及支持向量机一样,RVM不具有代价敏感性,不能直接用于代价敏感学习。针对监督学习中错误分类带来的代价问题,提出代价敏感相关向量分类(CS-RVC)算法,在相关向量机的基础上,通过赋予每类样本不同的误分代价,使其更加注重误分类代价较高的样本分类准确率,使得整体误分类代价降低以实现代价敏感挖掘。实验结果表明,该算法具有良好的稀疏性并能够有效地解决代价敏感分类问题。
苏乐群冯爱民
PUseqClust:一种RNA-seq数据聚类分析方法被引量:4
2019年
基因的聚类分析是基因表达数据分析研究的重要技术,它按照表达谱相近原则将基因表达数据归类,探究未知的基因功能.近年来,RNA-seq 技术广泛应用于测量基因表达水平,产生了大量的读段数据,为基因表达聚类分析提供了充分条件.由于读段非均匀分布的特性,对读段计数一般采用负二项分布进行建模.现有的负二项分布算法和传统的聚类算法对于聚类分析都是直接对读段计数进行建模,没有充分考虑实验本身存在的各种噪声,以及基因表达水平测量的不确定性,或者对聚类中心的不确定性考虑不够.基于 PGSeq 模型,模拟读段的随机产生过程,采用拉普拉斯方法考虑多条件多重复基因表达水平之间的相关性,获得了基因表达水平的不确定性,联合混合 t 分布聚类模型,提出 PUseqClust(propagating uncertainty into RNA-seq clustering )框架进行 RNA-seq 读段数据的聚类分析.实验结果表明,该方法相比其他方法获得了更具生物意义的聚类结果.
石险峰刘学军张礼
关键词:RNA-SEQ聚类分析负二项分布
改进的RNA-Seq数据转录组表达分析研究被引量:3
2015年
基于高通量测序的RNA-Seq(RNA-sequencing)是用于转录组研究的一种新技术,针对该技术在转录组表达分析研究中存在的读段多源映射和读段非均匀分布等难点,提出一个改进的转录组表达研究方法 LDASeqII(Improvement of latent Dirichlet allocation for sequencing data)。模型利用剪接异构体结构信息对参数进行约束并进行外显子读段数目归一化处理,解决了读段非均匀分布下的多源映射问题。通过引入"伪外显子"和"伪转录本"分别处理接合区读段和噪声读段。将模型应用到真实数据集上,并与原LDASeq(Latent Dirichlet allocation for sequencing data)模型和目前流行的Cufflinks与RSEM(RNA-Seq by expectation maximization)方法进行对比。结果显示,改进方法获得了更为准确的转录本及基因表达水平计算结果。
石新新刘学军张礼
关键词:基因表达RNA-SEQ非均匀性
基于RNA-seq数据的差异基因和异构体检测被引量:2
2016年
基因和异构体表达水平的差异检测是获取基因和异构体功能的重要途径,目前差异检测已经是转录组研究中一个重要的研究方向.RNA-seq技术近年来被广泛用于差异基因的检测.为模拟读段的非均匀分布,通常采用负二项分布对读段计数进行建模.现存的负二项分布模型大都是直接对基因读段计数进行建模,不能进行差异异构体检测.提出基于PGseq模型计算出的基因和异构体表达水平的负二项分布模型,采用exact test方法进行差异分析,解决了异构体的差异检测的问题.经实验验证,该方法在基因和异构体两方面的差异检测中都具有较高的准确度和灵敏度.
王黎黎刘学军张礼
关键词:RNA-SEQ差异基因负二项分布EXACTTEST
基于并行计算的大规模外显子芯片数据分析
2015年
快速准确地计算出转录组表达水平对转录组研究具有重要的作用。本文针对伽玛分布的概率模型(Gamma model for exon array data,GME)在处理大规模外显子芯片数据集上效率低下的特点,提出一种充分利用多核处理机或者集群环境来提高效率的并行计算方法。首先分析GME模型的原理,其次分析模型并行算法的选择,最后在不同规模的数据集上分析并行计算的效率。通过实验验证了并行计算极大地提高了模型的计算效率。实验结果表明,与先前的串行计算相比,并行计算使得GME模型更适用于大规模的外显子芯片分析。
张武军刘学军张礼
关键词:基因表达并行计算
基于CST参数化方法的翼型快速设计被引量:8
2011年
为弥补传统飞机翼型设计周期长、代价高的缺点,将CST翼型参数化方法,与机器学习中的高斯过程回归方法相结合,通过对已有的翼型数据的学习,实现对未知翼型气动性能或者外形数据的快速准确预测。选取一组NACA四位族翼型,获得其CST参数描述数据,并分别计算其在一定条件下的升力系数、阻力系数和压力分布数据。利用这些数据对高斯过程回归模型进行训练,实现了翼型的快速正设计以及反设计系统。并将实验结果与采用NACA翼型参数表示法得到的预测结果进行了对比。实验结果表明,基于CST参数化方法的翼型快速设计准确度高、速度快,具有很大的应用价值。
徐亚峰刘学军吕宏强
关键词:翼型设计
共2页<12>
聚类工具0