代琦
- 作品数:4 被引量:6H指数:2
- 供职机构:杭州电子科技大学自动化学院生物医学工程与仪器研究所更多>>
- 发文基金:国家自然科学基金国家杰出青年科学基金浙江省自然科学基金更多>>
- 相关领域:生物学医药卫生更多>>
- 基于集成类随机森林方法的神经胶质瘤特征基因选择的研究被引量:4
- 2010年
- 神经胶质瘤(glioma)是一种严重的颅内肿瘤疾病,具有高复发率、高死亡率和低治愈率等特点。利用基因微阵列数据识别与神经胶质瘤相关的特征基因,对该疾病的临床诊断和生物医学研究将起到有益的参考和借鉴作用。作者针对神经胶质瘤数据,提出了一种集成类随机森林特征基因选择方法。首先应用有监督奇异值分解对数据进行降维并粗选出基因;其次应用类随机森林特征选择方法选出特征基因。实验结果显示,该方法对分类器的适应性强;对比其他方法,分类率优势明显;更重要的是,在选出的前50个特征基因中有39个基因与神经胶质瘤或肿瘤细胞生物过程存在着密切联系,证实该方法不仅保持了较高的分类率,而且保证了选择的特征基因具有很强的生物学关联意义,具有较高的可行性和实用性。
- 来海锋韩斌厉力华陈岩祝磊代琦
- 关键词:神经胶质瘤肿瘤诊断奇异值分解
- 基于诊断结果相关性分析的肿瘤基因标志物提取方法
- 2010年
- 目的基于微阵列数据,提出提取肿瘤诊断结果相关的基因标志物。方法混合滤波和缠绕方法,采用奇异值分解,以基因和肿瘤诊断结果的相关强度为主要标准,辨识基因标志物,利用基于信息增益的随机森林法对分类率做辅助修正。本方法在3个公共数据库上和常用分类器上做了测试。结果 MonteCarlo统计实验表明,对于Colon数据集,本文方法在NN,RF分类器上显著优于t-test方法;在Prostate数据集上,本文方法在NB的分类器上显著优于对手,在其他数据集和分类器上本方法优于对手但不显著;而在基因稳定度指标上,本方法普遍优于对手。结论提出1种可以定量的,基于可视化的分析基因和诊断结果相关性的方法,与经典方法相比,本文方法提取的基因不仅具有较强的分类性能和对不同分类算法的适应性,而且在总体上也具有较好的基因稳定度。
- 韩斌陈岩来海锋厉力华祝磊代琦
- 关键词:肿瘤分类基因选择微阵列奇异值分解
- 基于磷脂质类数据的早期卵巢癌特征提取研究
- 2010年
- 卵巢癌是目前死亡率最高的妇科疾病之一,而如果得到早期诊断和治疗,卵巢癌患者的存活率可达90%。针对卵巢癌早期诊断问题,基于卵巢癌磷脂质类数据,提出了一种结合缠绕法和过滤法、按照诊断类别相关度挑选特征,然后依据特征标志物的分类率稳定度高低,提取用于诊断早期卵巢癌的特征子集的策略。该方法克服了分类率监督方法忽略生物相关性、依赖分类器易产生过拟合的不足,同时保持了较高的分类率。实验表明,该方法挑选的特征标志物包含更多的分类信息,其分类正确率达到88.9%,且比经典的分类率监督方法和差异表达方法在稳定性能上存在优势。此外,提出的新的标幺化方法去掉了批次差异,获得更好的分类效果,且所选的特征标志物得到生物学关联意义上的支持,具有较高的可信度和实用性。
- 陈淑飞韩斌厉力华Rebecca Sutphen祝磊代琦
- 关键词:卵巢癌稳定度奇异值分解MONTE
- 一种基于有监督奇异值分解和随机森林的卵巢癌磷脂代谢物特征提取方法被引量:3
- 2010年
- 卵巢癌是一种常见的妇科肿瘤,死亡率占各类妇科肿瘤的首位。选取既有较高的分类疾病模式能力又具有生物学关联的特征肿瘤标志物用于肿瘤的诊断是目前研究的重点。本研究针对卵巢癌磷脂代谢物数据的问题,提出了一种融合有监督奇异值分解和基于信息增益的随机森林决策的方法用于特征标志物的选择。首先应用有监督奇异值分解计算各标志物的权重值,并根据权重值粗选出候选标志物;其次应用基于信息增益的随机森林决策理论从候选标志物中选出特征标志物;最后通过SVM分类器测试,分类率高达90%以上。本研究方法与其他常用方法比较具有一定优势,其中一个明显的特点是所选特征标志物不但保持了较高的分类率,而且具有生物学关联意义,从而证实本研究方法具有较高的可行性和实用性。
- 来海锋韩斌厉力华陈岩SUTPHEN Rebecca祝磊代琦
- 关键词:奇异值分解特征提取卵巢癌