李启寨
- 作品数:9 被引量:36H指数:2
- 供职机构:中国科学院数学与系统科学研究院更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家高技术研究发展计划更多>>
- 相关领域:理学生物学农业科学更多>>
- 混合卡方随机变量和的近似分布的一个注记被引量:2
- 2015年
- 用形如b_1χ_(m_1)~2+b_2χ_(m_2)~2+c的随机变量的分布来近似混合卡方随机变量和的分布.采用前五阶累积量来确定分布函数的参数,给出了基于密度函数的误差上界并且证明该方法比文献中所用的形如ξχ_d^2+η的近似方法更能有效地控制犯第一类错误的概率.
- 熊景宏李启寨
- 关键词:累积量
- 基于广义和校准马氏距离对IP地址威胁程度的诊断被引量:2
- 2015年
- 域名系统(DNS)是互联网的重要组成部分.维护DNS健康安全对整个互联网的正常运行具有十分重要的意义.通过监测并屏蔽对域名服务器具有潜在威胁的用户IP地址,达到维护DNS健康安全的目的.本文提出基于广义和校准的马氏距离2种方法,综合多个指标对IP地址的威胁程度进行诊断.这2种方法可以解决协方差阵不可逆的情形.将2种改进的马氏距离应用到实际访问DNS报文数据分析中,结果表明,它们在诊断IP的威胁程度上是非常有效的.
- 钞婷李启寨刘卓军孙才孙云刚
- 关键词:DNS
- 多响应的分组Hotelling’s T^2检验(英文)
- 2019年
- 两样本的多响应比较在实际中应用非常广泛.当样本不服从正态分布时,Hotelling’s T^2检验(HT)的功效普遍不高.为了解决这一问题,本文提出了分组Hotelling’s T^2检验(GHT),即对数据进行逆正态变换后,在每一组中进行HT,然后基于每组的p值构造统计量并取最大值.大量模拟表明,GHT比HT和其他已有检验更加稳健.最后,应用于血浆肾素活性和大脑衰老数据进一步验证GHT的有效性.
- 张胜虎张三国李启寨
- Rank-based Robust Tests for Quantitative-trait Genetic Association Studies
- Standard linear regression is commonly used for genetic association studies of quantitative traits.This approa...
- 李启寨
- 相邻碱基组分与产生SNP的转换或颠换在植物基因组中的研究被引量:23
- 2006年
- 碱基替换突变是形成物种多态性和造成生物进化的根本原因之一.近年的研究表明:基因组的碱基组分在不同程度上与碱基替换突变的发生相关.以水稻全基因组3611007个SNPs(包括45462个编码区SNPs和242811个内含子区SNPs)和拟南芥全基因组32019个SNPs为研究对象,研究突变位点周围的碱基A&T(A和T)的使用频率和点突变类型的相关性,结果表明:水稻和拟南芥全基因组上转换和颠换的比值(Ts/Tv)以及紧邻突变位点(上下游各1个碱基)上A&T碱基的个数负相关.统计了6种SNP的AT2(直接相邻的碱基是A或T的个数)和AT0(直接相邻碱基是C或G的个数),发现水稻和拟南芥都是C/G型SNP的AT2/AT0值最大,说明C/G型SNP可能受直接临近区域上A&T碱基的影响最大.在水稻全基因组SNPs中,A&T碱基影响突变的范围局限在突变位点上下游2个碱基内.拟南芥A&T碱基影响其全基因组SNPs的范围不超过上下游4个碱基.
- 赵辉李启寨李俊曾长青胡松年于军
- 关键词:点突变颠换
- 二次型统计量与柯西统计量
- 2021年
- 二次型统计量是多元统计分析中假设检验问题的常用统计量,许多假设检验问题的统计量都可以转换成二次型统计量的形式.在零假设成立的条件下,二次型统计量渐近服从卡方分布.本文通过对协方差矩阵进行特征值分解,构造了一族二次型统计量,它包含常见的二次型统计量.在零假设成立的条件下,我们证明了族中每个二次型统计量的渐近分布与若干个相互独立服从自由度为1的卡方分布的随机变量加权和相同.由于计算其统计显著性较为困难,我们提出利用广义伽马分布来近似统计量的渐近分布,进而,我们构造了一个柯西统计量并给出计算其统计显著性的显式表达式.模拟结果和实例分析表明,柯西统计量比二次型统计量更稳健,许多情况下功效更高.
- 王子轩王晋娟李启寨
- 全基因组关联研究综述被引量:7
- 2014年
- 本文是对近十年来科学前沿热点问题之一的全基因组关联研究(genome-wide association study,GWAS)的一个综述,侧重于介绍其中所用到的统计分析方法,讨论当前GWAS中存在的一些问题及挑战,并就其发展前景作一个展望.
- 潘东东李正帮张维李启寨
- 关键词:全基因组关联研究单核苷酸多态性贝叶斯因子
- 分组检测方法综述被引量:2
- 2016年
- 分组检测是一种经济且有效的检测算法。它在流行病学、农业及基因组学等领域有着广泛的应用。本文主要从分组检测的起源、发展及其应用着手,着重于介绍分组检测算法中的统计推断方法,并讨论了目前分组检测算法面临的一些问题和挑战。
- 熊文俊丁娟李启寨
- 关键词:患病率敏感性特异性
- 封闭总体的统计推断及在基因表达中的应用
- 本文研究了两个方法上十分类似的问题:封闭总体大小的推断和组织中基因表达的推断。
在生态学、生命科学、流行病学及社会科学等研究领域,了解某种生物种群(统计学上称之为总体)大小具有重要的科学和实际意义。为了了解某一总体...
- 李启寨
- 关键词:基因表达统计推断