目的利用生物信息学分析方法,结合GEO数据库,探讨获取结直肠肿瘤关键基因的差异表达情况。方法使用GEO数据库分析结直肠肿瘤患者的肿瘤组织和正常组织基因表达数据,使用GEO2R筛选差异表达基因(differential expression genes,DEGs),利用David数据库对DEG进行基因本体论(gene ontology,GO)富集分析,获得DEG的分子功能、细胞组分和生物过程结果,利用基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)获取差异基因在疾病状态下的信号通路信息,构建差异基因间蛋白质相互作用网络,并使用Cytoscape软件对网络中的关键节点进行拓扑分析,筛选出结直肠肿瘤患者发生过程中的关键基因。结果通过对GSE21510数据集的生物信息学分析,共鉴定到664个DEGs,其中结直肠肿瘤患者高表达基因234个,低表达基因430个。这些DEGs主要参与细胞分裂、RNA聚合酶II启动子转录正和负调控等生物过程,同时参与细胞核、胞质、细胞质、核浆、细胞膜等细胞成分组成,并参与蛋白质绑定、ATP绑定等分子功能的表达和实现等过程,通过蛋白质网络分析确定高表达基因CDK1、CCNB1、TOP2A、AURKA、UBE2C、BUB1、CHEK1、RRM2、MYC、TPX2和低表达基因SLC26A3、CLCA4、GUCA2A、MS4A12、ZG16、GUCA2B、CLCA1、AQP8、MT1E、MT1G为关键基因。生存分析结果显示,关键基因CCNB1低表达与CRC患者预后较差显著相关(logrank P<0.01);此外,CCNB1基因与肿瘤病理分期显著相关(P<0.01)。结论所筛选的关键基因可能成为诊断或治疗结直肠肿瘤的的标志物或潜在靶点,本研究结果为结直肠肿瘤的发病机制、治疗方法等领域的研究提供了理论参考。