您的位置: 专家智库 > >

王世祥

作品数:2 被引量:5H指数:2
供职机构:天津大学化工学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:生物学医药卫生更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 1篇生物学
  • 1篇医药卫生

主题

  • 2篇模式识别
  • 2篇基因
  • 2篇甲基化
  • 1篇特征基因
  • 1篇肿瘤
  • 1篇肿瘤进展
  • 1篇吸烟
  • 1篇吸烟史
  • 1篇细胞
  • 1篇细胞癌
  • 1篇腺癌
  • 1篇鳞状
  • 1篇鳞状细胞
  • 1篇鳞状细胞癌
  • 1篇拷贝数
  • 1篇拷贝数变异
  • 1篇基因甲基化
  • 1篇基因识别
  • 1篇肺鳞状细胞癌
  • 1篇肺腺癌

机构

  • 2篇大连医科大学...
  • 2篇天津大学
  • 1篇德克萨斯大学

作者

  • 2篇宋凯
  • 2篇张飞
  • 2篇王玲
  • 2篇王世祥

传媒

  • 1篇生物化学与生...
  • 1篇中国生物医学...

年份

  • 2篇2016
2 条 记 录,以下是 1-2
排序方式:
肺腺癌吸烟相关甲基化模式识别分类模型及特征基因的识别研究被引量:2
2016年
吸烟是导致肺癌的一个重要诱导因素,从全基因组基因甲基化水平出发,利用生物信息学方法,通过建立对当前吸烟/不吸烟样本的模式识别分类模型,识别甲基化特征基因,为揭示不吸烟肺癌患者的患病机理奠定基础。为避免甲基化微阵列数据超高维小样本、高噪声、高相关性以及信息饱和现象淹没真正的特征基因,首次采用迭代多重筛选方法,分别从显著性差异、与基因表达水平的关系、生物功能、分类重要性等多个角度对全基因组甲基化数据进行多步筛选,从而识别吸烟相关特征基因。以TCGA数据库中127个肺腺癌样本为训练集,64个EDRN肺腺癌样本为独立测试集,最终确定了48个关键基因。相应模式识别模型对训练集精度达到87.5%(敏感性、特异性分别为87.2%和87.8%),独立测试集分类精度达到76.4%(敏感性、特异性分别为80.2%和73.6%)。交叉研究表明,其中17个基因对癌症发展的重要性已经在其他研究中有所证实,进一步的研究则证明其甲基化的重要性。同时,KEGG和IPA对特征基因在基因调控网络和代谢通路水平的分析表明,特征基因与癌症的发展以及生物功能、细胞发育等都有着密切的联系。
王世祥张飞王玲宋凯
关键词:肺腺癌吸烟史模式识别
肺鳞状细胞癌癌症发展模式识别分类模型及特征基因识别被引量:3
2016年
本文利用先进的生物信息学方法,首次从全基因组水平综合基因表达、甲基化水平和拷贝数变异三类数据,寻找与肺鳞状细胞癌(LUSC)发生和发展密切相关的特征基因,为进一步解释其内在机理、开发新的靶向药物和治疗手段提供更加深入的理论依据.为克服全基因组数据超高维高噪声小样本特性对机器学习算法性能的影响,防止信息饱和现象的干扰,本文创新性地组合应用4种特征基因筛选方法,分别从特异性、相关性、生物学功能和对肿瘤分类模型的贡献等多个方面,通过迭代降维技术递归筛选真正的特征基因.研究中,我们以TCGA(The Cancer Genome Atlas projecO数据库中的LUSCI~Ⅲ期病人样本为例,对其基因表达数据(GE)、基因甲基化数据(ME)以及拷贝数变异数据(CNV)进行分析.结果筛选出67个GE特征基因,对3类样本分类的平均准确率达到86.29%,70个ME特征基因,相应的分类准确率为90.92%,31个CNV特征基因,相应的分类准确率为69.16%.KEGG(Kyoto Encyclopedia of Genesand Genomes)和IPA(Ingenuity Pathway Analysis)对上述3类特征基因集在代谢通路水平和基因调控网络水平上的分析,证明了其在调控水平上的密切关系.同时也表明,识别的特征基因与LUSC肿瘤进展之间有着重要的直接关系,这对了解肿瘤机理以及新靶向治疗的发展非常重要.
张飞王世祥王玲宋凯
关键词:肺鳞状细胞癌基因甲基化拷贝数变异肿瘤进展模式识别
共1页<1>
聚类工具0