李贞子
- 作品数:7 被引量:56H指数:4
- 供职机构:哈尔滨医科大学更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金哈尔滨市科技创新人才研究专项资金项目更多>>
- 相关领域:医药卫生理学生物学更多>>
- 主成分Logistic回归在筛选冠心病危险因素中的应用被引量:5
- 2012年
- 目的探讨主成分Logistic回归方法在筛选冠心病危险因素中的应用。方法选择2009年4月-2010年8月在哈尔滨医科大学第一附属医院行冠脉造影术者,按照金标准分为冠心病组(465例)和对照组(277例);首先对Lo-gistic回归模型进行共线性诊断,然后应用主成分改进的Logistic回归分析,得到并解释最终的回归模型。结果共线性诊断提示各变量之间存在明显的共线性,采用主成分改进的Logistic回归分析显示,冠心病与年龄、性别、载脂蛋白A、TG、HDL-C、糖尿病史、高血压史、吸烟史在内的多种因素有关。结论主成分改进的Logistic回归在筛选冠心病危险因素中具有较好的作用,在对疾病危险因素进行Logistic回归分析时,若多变量间存在多重共线性,采用主成分改进的Lo-gistic回归分析能得出更好的回归模型。
- 行岳真祁瑞李金梅李贞子王丽敏孙宏刘艳马葆华隋虹
- 关键词:冠心病主成分LOGISTIC回归
- 基于小波变换的代谢组色谱指纹图谱的判别分析
- 2013年
- 目的探索小波变换在代谢组学超高效液相色谱信号分析中的作用。方法将卵巢癌和卵巢囊肿的色谱数据使用不同的连续小波基函数和不同尺度变换,随机抽取一定数量的训练数据,采用随机森林(RF)方法进行特征筛选建立模型,最后对测试数据集进行判别分析,计算ROC曲线下面积AUC值。结果经过小波变换预处理后的数据建模分类效果明显优于原始数据,其中墨西哥帽(mexh)小波变换分类效果最好。结论基于小波变换的代谢组特征提取方法能够明显提高模型的判别能力,具有研究价值。
- 孙凤宇李贞子侯艳李康
- 关键词:小波变换色谱
- 卵巢癌脂质组学诊断标志物的筛选及其效果研究被引量:11
- 2016年
- 目的卵巢癌是女性生殖器官常见的恶性肿瘤之一,90%的卵巢癌患者诊断时已进展到晚期(Ⅲ/Ⅳ期)。尽管治疗方式的不断改进,但晚期卵巢癌患者5年总生存率为20%,而早期卵巢癌患者5年总生存率>90%。本研究旨在识别卵巢癌脂质组学诊断生物标志物,提高卵巢癌早期诊断的准确性。方法采用稀疏组lasso变量筛选方法和单因素分析相结合的方法,对2011-03-01-2013-07-31哈尔滨医科大学附属肿瘤医院的139例卵巢癌患者和76例对照患者的血浆脂质组学数据进行分析,筛选可用于诊断卵巢癌脂质组学的生物标志物,在差异代谢物中选择与CA125相关性小的物质作为最终诊断标志物,通过七折交叉验证方法来评价其预测效果及与CA125联合的诊断准确性。进一步采用cytoscape软件研究差异脂质物质间的相互作用。通过Wilcoxon秩和检验方法筛选出能够区分早晚期卵巢癌的生物标志物。结果共筛选出20种可用于区分卵巢癌和对照的差异脂质生物标志物,其中Stearamide、Stearic acid、Arachidic acid和PI(42∶9)与CA125不相关(P<0.05),这4个脂质与CA125联合AUC值为0.94,大于CA125单独的诊断性能。另外,其中8个差异脂质在早期与晚期上皮性卵巢癌患者中有差异,分别为PC(35∶4)、PC(38∶6)、PC(46∶4)、PC(P-35∶2)、PE(P-36∶6)、PG(34∶2)、Cer(d18∶1/16∶0)和3-Deoxyvitamin D3,均P值<0.05。结论卵巢癌血浆脂质组学筛选出的物质提高了CA125单独诊断的准确性,其中8个差异物质可以作为卵巢癌早期诊断潜在的生物标志物。
- 谢宏宇王文杰李贞子夏白荣李康侯艳
- 关键词:卵巢癌诊断标志物
- 代谢组学在自身免疫性疾病研究中的应用进展被引量:2
- 2015年
- 代谢组学技术应用于自身免疫性疾病的研究,筛选出的代谢物不仅能够反映葡萄糖、氨基酸和脂代谢,还能够反映神经递质、核苷酸、免疫应答和抗炎反应,其为自身免疫性疾病的诊断、治疗和机制研究提供了有效的研究方法。
- 武晓岩李贞子王涵
- 关键词:代谢组学自身免疫性疾病生物标志物
- 多步骤决策树方法在基因表达数据上的应用研究被引量:2
- 2017年
- 基因芯片技术得到的基因表达谱数据具有维数高、噪声大、样本量小、非线性等特点,如何从高维数据中提取含在其中的生物学信息,是医学和生物学研究中面临的一个重大挑战。基因表达数据分析的重要任务是筛选差异表达基因及对基因或样品进行分类,通过比较正常和疾病状态下基因表达的差异,研究疾病的发病机制、早期诊断和治疗方法。
- 马李冰侯艳李贞子李康
- 关键词:基因表达数据决策树方法高维数据主成分分析基因芯片技术信息增益
- 惩罚logistic回归方法在SNPs数据变量筛选研究中的应用被引量:4
- 2016年
- 目的比较L1正则化、L2正则化和弹性网三种惩罚logistic回归对SNPs数据的变量筛选能力。方法根据所设置的参数生成不同条件的SNPs仿真数据,利用正确率、错误率和正确指数从三个方面评价三种惩罚logistic回归的变量筛选能力。结果正确率表现为L2正则化惩罚logistic回归>弹性网惩罚logistic回归>L1正则化惩罚logistic回归;错误率表现为L2正则化惩罚logistic回归>弹性网惩罚logistic回归>L1正则化惩罚logistic回归;正确指数则表现为弹性网惩罚logistic回归>L1正则化惩罚logistic回归>L2正则化惩罚logistic回归。结论综合来看弹性网的筛选能力更优,弹性网融合L1、L2两种正则化的思想,在高维数据分析中既能保证模型的稀疏性,便于结果的解释,又解决了具有相关性自变量不能同时进入模型的问题。
- 刘匆提李昂门志红姜博肖纯刘艳李贞子
- 关键词:L1正则化
- 随机森林回归分析及在代谢调控关系研究中的应用被引量:32
- 2012年
- 目的探讨随机森林回归处理非线性、具有交互作用数据的性能,并将其应用于高维代谢组学数据的代谢网络变量筛选。方法通过模拟试验验证随机森林回归在具有交互作用和非线性情况下回归分析的效果,同时应用于卵巢良恶性肿瘤鉴别的代谢组学数据分析。结果模拟实验结果显示:对于具有交互作用及其他非线性关系的模拟数据,随机森林回归模型的效果明显优于多元线性回归模型;卵巢癌代谢组学数据分析显示,使用随机森林回归分析能够获得更为理想的结果。结论随机森林回归作为一种非参数回归技术,在一定的样本含量下(如n>100),能够在高维数据中有效地分析具有交互作用和非线性关系的数据。
- 李贞子张涛武晓岩李康
- 关键词:代谢组学