董晓强
- 作品数:3 被引量:5H指数:2
- 供职机构:山西医科大学公共卫生学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:医药卫生理学更多>>
- 基于non-local先验的贝叶斯变量选择方法及其在高维数据分析中的应用
- 2020年
- 目的对高维数据进行变量筛选并构建预测模型是组学数据分析的研究热点之一。本研究旨在为结局为二分类变量的高维组学数据筛选自变量并构建预测结局的稀疏统计模型。方法本研究通过模拟研究和实例分析阐释基于non-local先验的贝叶斯变量选择方法--乘积逆矩先验(product inverse moment,piMOM)相较于惩罚类方法ISIS-光滑平切绝对偏差(iterative sure independence screening-smoothly clipped absolute deviation,ISIS-SCAD)和ISIS-最小最大凹惩罚(iterative sure independence screening-minimax concave penalty,ISIS-MCP)在高维数据中变量筛选及其预测效果的性能优劣。结果模拟研究发现:在高维的情况下,经piMOM、ISIS-SCAD和ISIS-MCP方法筛选所得变量的平均真阳性数和受试者工作特征曲线下面积(AUC,area under curve)基本相等,ISIS-SCAD、ISIS-MCP的平均假阳性数、回归系数均方误差以及预测均方误差明显高于基于non-local先验的贝叶斯变量方法所获得的对应值。piMOM方法分析弥漫大B细胞淋巴瘤实例数据共识别5个有意义的基因,AUC为0.996;ISIS-SCAD识别7个基因,AUC为0.975;ISIS-MCP识别7个基因,AUC为0.968。结论在模型选择相合性和预测准确性方面,piMOM方法与ISIS-SCAD和ISIS-MCP相比,具有优势,在一定意义上可有效控制假阳性率。
- 马金沙董晓强高倩陶然许树红李艳艳王彤
- 关键词:高维数据弥漫性大B细胞淋巴瘤
- 高维组学数据分析中的贝叶斯变量选择方法被引量:2
- 2017年
- 随着基因组测序技术和生物信息学的迅猛发展,近几年涌现了大量与疾病相关的组学数据即所谓高维数据。对于这类组学数据,共同特点是自变量个数p通常远大于观察例数n,且自变量间往往高度相关,从成千上万个组学数据中识别出真正有意义的自变量带来一些统计学挑战。本文对高维数据中的贝叶斯变量选择方法做论述。
- 董晓强许树红陶然王彤
- 关键词:高维数据
- MicroRNA与弥漫大B淋巴瘤预后关系的系统综述和Meta分析被引量:3
- 2018年
- 目的综合分析不同的微小RNA(microRNAs,miRs)对弥漫大B淋巴瘤(diffuse large B cell lymphoma,DLBCL)的预后价值。方法计算机检索2007年1月~2017年7月收录在万方数据库、维普中文科技期刊全文数据库、中国期刊全文数据库、PubMed数据库和Embase数据库的相关文献,筛选后采用Stata 12.0进行Meta分析。结果最终纳入30篇文献,2 574研究对象。综合分析发现,miR-21的低表达降低了DLBCL患者的无复发生存期(relapse free survival,RFS)(HR=0.61,95%CI:0.40~0.94,P=0.024);miR-155的高表达降低了DLBCL患者的无进展生存期(progress free survival,PFS)(HR=2.50,95%01:1.54~4.06,P<0.001);miR-222的高表达降低了DLBCL患者的PFS(HR=2.33,95%CI:1.53~3.57,P<0.001)。结论基于所有分析结果可知,miR特别是miR-21,miR-222和miR-155是影响DLBCL的RFS和PFS重要预后因子。
- 李璐董晓强李艳艳郭建全乔增杰王彤
- 关键词:预后META分析