孙琳
- 作品数:3 被引量:15H指数:3
- 供职机构:哈尔滨医科大学更多>>
- 发文基金:黑龙江省自然科学基金国家自然科学基金国家科技支撑计划更多>>
- 相关领域:医药卫生理学更多>>
- 多次交叉验证对PLSDA模型的影响研究被引量:5
- 2017年
- 目的比较一次交叉验证和多次交叉验证对PLSDA最优模型的影响,探讨在个体正确分组和少数个体错分时,多次交叉验证对PLSDA最优模型稳定性的影响。方法打乱数据集中个体顺序进行多次交叉验证,通过一次交叉验证和多次交叉验证的方法对模拟数据和真实数据进行分析,使用成分数和MSEP等参数值来评价模型变异性和稳定性。结果模拟数据结果,仅进行1次交叉验证结果成分数为3,MSEP值为0.3792;在不打乱数据标签时,5000次交叉验证结果中,成分数范围是2~6,MSEP值的范围0.2569~0.5794;打乱5%的标签时,5000次交叉验证结果中,成分数范围是1~8,MSEP值的范围0.2061~0.6463;真实数据结果,进行1次交叉验证结果成分数为4,MSEP值为0.1376;10000次交叉验证成分数范围是4~10,MSEP范围是0.0802~0.3761。结论一次交叉验证结果不稳定,在应用PLSDA建模时,多次交叉验证在少量个体错分时能够获得稳定模型,建议使用多次交叉验证确保PLSDA模型稳定性。
- 曲思杨张秋菊王文佶谢彪孙琳高兵刘美娜
- 关键词:高维数据
- 动态代谢组学数据分析方法介绍被引量:5
- 2016年
- 近年来,代谢组学发展迅速并广泛应用于营养学、毒理学、疾病诊断等各个领域。随着研究的深入,代谢组学所获得的数据集因研究设计的不同而日益复杂,产生了有时间间隔的动态代谢组学数据。然而目前分析此类数据的方法十分有限,并且在大多数情况下,这种动态数据所带来的因时间因素产生的变异直接被忽略。
- 王文佶张秋菊曲思杨谢彪高兵孙琳刘美娜
- 关键词:代谢组学数据集疾病诊断动态数据营养学毒理学
- 基于色谱-质谱平台的代谢组学数据预处理方法被引量:6
- 2017年
- 代谢组学的概念自20世纪90年代被正式提出,已被广泛应用于医学研究领域,其一般研究流程包括样本采集、样本检测、数据预处理、数据分析和生物学解释等。常用的样本检测技术有核磁共振(nuclear magnetic resonance,NMR)和高分辨率色谱-质谱联用技术,本文所述方法针对后者。
- 孙琳张秋菊王文佶曲思杨谢彪高兵刘美娜
- 关键词:代谢组学数据预处理方法色谱-质谱高分辨率噪声强度缺失数据