高倩
- 作品数:15 被引量:35H指数:4
- 供职机构:山西医科大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:医药卫生理学文化科学自动化与计算机技术更多>>
- 基于LASSO的FDR控制方法及其在高维数据生存分析中的应用被引量:5
- 2018年
- 目的基于LASSO-Cox模型探索交叉验证(cross validation)、pcvl法(penalized cross-validated log-likelihood)、EBIC准则(extended bayesian information criterion)、平稳选择(stability selection)四种方法在控制FDR(false discovery rate)方面的表现及其变量选择效果。方法通过模拟研究评价各方法在不同删失比例、自变量间不同相关程度以及回归系数的不同稀疏水平下的FDR和PSR(positive select rate),并从GEO上下载DLBCL数据进行基因与预后间的关联分析。结果模拟结果表明,在不同删失比例、自变量相关程度和稀疏水平的情况下,平稳选择法控制FDR的能力都优于其他方法且其变量选择效能也较高。EBIC准则在相关程度低、自变量较稀疏时表现较好,当样本量较小时结果较保守。pcvl法虽然不容易漏掉有效应的变量,但其FDR仍较高。实例结果显示,EBIC准则只选出1个基因,平稳选择法选出的基因中大部分有统计学意义且与其他方法的结果重合度高。结论在基于LASSO-Cox模型的高维数据生存分析中平稳选择法能较好地控制FDR且其变量选择效能也较高。
- 许树红董晓强陶然高雪高倩高倩王彤
- 基于group LASSO的高维广义倾向性评分方法
- 本发明为一种基于group LASSO的高维广义倾向性评分方法,属于生物技术和数据分析技术领域。本发明首先借用GLiDeR的思想构建结局自适应group LASSO实现变量选择;随后使用npCBGPS方法计算均衡权重,并...
- 高倩王彤
- PDE4B基因过表达对弥漫大B细胞淋巴瘤患者的预后价值被引量:7
- 2017年
- 目的探讨磷酸二酯酶4B(phosphdiesterase 4B,PDE4B)基因过表达对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者预后的影响,并分析其预后价值。方法从GEO(gene expression omnibus)数据库获得320例DLBCL患者的基因芯片数据,比较PDE4B基因过表达与正常表达患者生存率的差异。构建单变量国际预后指数(international prognostic index,IPI)、PDE4B和多变量(IPI+PDE4B)Cox比例风险模型,并用时点/动态受试者工作曲线(receiver operating characteristic curves,ROC)法分析模型的预测能力随时间的变化趋势,一致性统计量C用于评价和比较各模型的预测准确度。结果 PDE4B基因过表达的患者死亡的风险是正常表达的1.431倍(HR=1.431,95%CI:1.013~2.002,P=0.042)。多变量模型的C统计量与单变量模型相比,差异有统计学意义(IPI vs.IPI+PDE4B:Z=15.0,P<0.001;PDE4B vs.IPI+PDE4B:Z=53.7,P<0.001)。结论 PDE4B基因过表达是DLBCL患者预后的危险因素,结合IPI和PDE4B基因能提高DLBCL的预后准确性。
- 高倩李艳艳申亚男虞明星李璐郗彦凤王彤
- 关键词:基因表达预后
- 医学研究中交互作用综述被引量:3
- 2020年
- 随着个体化治疗和精准医学的兴起,如何从广泛群体中发现不同亚人群的异质性是现代医学的终极问题和目标,由此开展更有针对性的精准预防和治疗可以得到更大的成本效益。解决此问题的出发点就是寻找病因学和人群健康效应异质性的原因,从统计学的角度看解决此类问题的方法之一就是寻找交互作用,以确定对不同卫生干预措施有显著健康收益的亚组[1-3]。医学研究中交互作用研究的结局通常是二分类变量,如疾病或某个事件是否发生。
- 王慧高雪高倩李艳艳和思敏余红梅王彤
- 关键词:个体化治疗病因学
- 基于高维自变量的广义倾向性评分方法研究与应用
- 目的: 观察性研究或非随机对照研究中常使用倾向性评分(PropensityScore,PS)法校正已测量混杂变量带来的偏倚以期实现因果关联分析。为了识别出感兴趣暴露/处理因素与结局变量间的因果性并得到处理效应的无偏估计...
- 高倩
- 关键词:因果推断
- 文献传递
- 基于non-local先验的贝叶斯变量选择方法及其在高维数据分析中的应用
- 2020年
- 目的对高维数据进行变量筛选并构建预测模型是组学数据分析的研究热点之一。本研究旨在为结局为二分类变量的高维组学数据筛选自变量并构建预测结局的稀疏统计模型。方法本研究通过模拟研究和实例分析阐释基于non-local先验的贝叶斯变量选择方法--乘积逆矩先验(product inverse moment,piMOM)相较于惩罚类方法ISIS-光滑平切绝对偏差(iterative sure independence screening-smoothly clipped absolute deviation,ISIS-SCAD)和ISIS-最小最大凹惩罚(iterative sure independence screening-minimax concave penalty,ISIS-MCP)在高维数据中变量筛选及其预测效果的性能优劣。结果模拟研究发现:在高维的情况下,经piMOM、ISIS-SCAD和ISIS-MCP方法筛选所得变量的平均真阳性数和受试者工作特征曲线下面积(AUC,area under curve)基本相等,ISIS-SCAD、ISIS-MCP的平均假阳性数、回归系数均方误差以及预测均方误差明显高于基于non-local先验的贝叶斯变量方法所获得的对应值。piMOM方法分析弥漫大B细胞淋巴瘤实例数据共识别5个有意义的基因,AUC为0.996;ISIS-SCAD识别7个基因,AUC为0.975;ISIS-MCP识别7个基因,AUC为0.968。结论在模型选择相合性和预测准确性方面,piMOM方法与ISIS-SCAD和ISIS-MCP相比,具有优势,在一定意义上可有效控制假阳性率。
- 马金沙董晓强高倩陶然许树红李艳艳王彤
- 关键词:高维数据弥漫性大B细胞淋巴瘤
- 高维情况下基于倾向性评分的因果推断方法
- 2021年
- 目的观察性研究中使用倾向性评分法估计因果效应依赖于不存在未测量混杂假设。随着大数据时代的到来,越来越多的处理前协变量可被测量并纳入分析中,使得这一假设更合理,但同时也导致标准的倾向性评分法不再适用,这就促使了高维情况下因果推断方法的发展。本研究对现有的高维情况下基于倾向性评分的因果推断方法进行概述,为实际应用提供参考依据。方法从变量选择和协变量组间均衡性两个角度出发,对现有方法做归类和总结,系统回顾各方法的基本原理、方法步骤及优缺点等。结果基于变量选择的方法可分为Screening、惩罚和贝叶斯三类;基于均衡性的方法有明确的机制确保协变量的组间均衡性。结论实际应用中研究者应根据自身数据特点结合各方法的优缺点选择合适的方法进行分析,从而得到一致有效的因果效应估计量。
- 高倩王彤
- 关键词:高维数据因果推断
- 倾向性评分模型估计二分类处理因果效应的方法
- 2023年
- 目的对倾向性评分(propensity score,PS)模型估计二分类处理因果效应的方法进行概述,以期为相关研究提供参考。方法从PS模型的优化和协变量组间均衡性两个角度对现有方法进行梳理,对各方法的基本原理、适用条件、优缺点等归纳总结。结果基于模型类的方法通过优化估计处理分配机制的模型,以得到更好均衡组间协变量分布的PS;基于均衡类的方法在协变量组间均衡性约束条件下估计PS或直接估计权重。结论研究者在实际应用中可根据不同方法的适用条件及优缺点选择合适的方法进行分析。
- 王文杰王文杰高倩
- 关键词:因果效应
- 癌症致病通路中互斥突变识别的统计模型
- 目的:本研究主要针对"互斥突变"的识别方法展开研究,重点介绍MEGSA算法的基本原理,找出最优互斥基因集,为基因药物的研制和癌症的诊断与治疗提供依据.
方法:模拟分析,比较不同参数设置下的MEGS准确检出率评价...
- 崔燕高倩王彤
- 关键词:恶性肿瘤统计模型
- EGFR-TKIs一线治疗晚期非小细胞肺癌的有效性和安全性比较:网状Meta分析被引量:11
- 2020年
- 目的比较吉非替尼、厄洛替尼和阿法替尼一线治疗晚期非小细胞肺癌(non-small cell lung cancer,NSCLC)的有效性和安全性。方法系统检索2008年12月-2018年12月收录在PubMed、EMBASE和The Cochrane Library中的相关文献进行贝叶斯网状meta分析。结果共纳入10篇文献,包含2 275名患者。就有效性而言,累积排序概率图下面积(surface under the cumulative ranking,SUCRA)显示厄洛替尼在无进展生存期(progression-free survival,PFS)方面最佳(0.88),阿法替尼在客观反应率(objective response rate,ORR)(0.82)和疾病控制率(disease control rate,DCR)(0.86)方面最佳,吉非替尼在PFS(0.45),ORR(0.42)和DCR(0.45)方面均最差。就安全性而言,仅厄洛替尼与含铂的双重化疗在3~4级不良反应率(OR=0.29,95%CI:0.08~0.98)和停药率(OR=0.14,95%CI:0.01~0.86)方面的差异有统计学意义。排序结果也支持厄洛替尼的安全性最好。SUCRA结果提示吉非替尼(0.31)发生3~4级不良反应的可能性比阿法替尼(0.57)小,其(0.44)发生停药的可能性与阿法替尼(0.41)相似。结论厄洛替尼可能是三者中一线治疗晚期NSCLC的首选药物。
- 张慧芳马金沙李璐高倩王彤
- 关键词:非小细胞肺癌吉非替尼厄洛替尼一线治疗