游晓璐
- 作品数:3 被引量:4H指数:2
- 供职机构:杭州电子科技大学生命信息与仪器工程学院更多>>
- 发文基金:国家自然科学基金浙江省公益性技术应用研究计划项目浙江省自然科学基金更多>>
- 相关领域:医药卫生更多>>
- 基于半监督学习的SELDI-TOF蛋白质质谱数据分析
- 癌症是世界上最为严重的公共问题之一,中国癌症发病率逐渐上升,但根据目前国内的水平,三分之一的癌症是可以预防的,有效提高癌症的早期诊断率已经被公认为是改善其疗效的关键。蛋白质组学及相关技术的发展给癌症病理的研究及预防等带来...
- 游晓璐
- 关键词:癌症诊断蛋白质质谱半监督学习
- 文献传递
- 基于聚类分析和半监督学习的蛋白质质谱数据分类被引量:2
- 2014年
- 目的针对高维冗余的SELDI蛋白质质谱数据,提出一种基于聚类分析和半监督学习的数据分类方法。方法算法首先运用t-test对蛋白质质谱数据进行初步降维;然后将处理后的数据用聚类分析算法进行进一步降维;最后运用半监督学习算法传递标签,充分提取有标记样本和无标记样本的信息,从而进行分类。结果在公共卵巢癌数据集OC-WCX2b和公共前列腺癌数据集PC-H4上获得了99.15%和96.75%分类准确率。在浙江省肿瘤医院临床乳腺癌数据集BC-WCX2a上获得了95.18%的分类准确率和100%的敏感性。结论基于聚类分析的半监督学习方法能够有效利用未标记的质谱样本信息,与经典的监督学习算法相比,其分类性能更理想、实用性更好。
- 祝磊曹凯敏游晓璐徐平应南娇
- 关键词:蛋白质质谱聚类分析半监督学习特征提取
- 基于多步降维和半监督学习的蛋白质质谱特征提取算法被引量:2
- 2013年
- 目的提出一种基于半监督学习的多步降维特征提取方法。方法算法首先运用t-test对样本特征进行筛选,初步降低特征维度;然后进行离散小波变换,对小波系数进行相对熵排序,筛选出新的特征子集;接着进行主成分分析,提取主成分;最后运用半监督学习算法BB-LLGC进行标签传递,充分提取有标记和无标记样本的判别信息。结果在公共卵巢癌数据集OC-WCX2b和公共前列腺癌数据集PC-H4上获得了99.13%和97.20%分类准确率。在浙江省肿瘤医院临床乳腺癌数据集BC-WCX2a上获得了92.78%的分类准确率和100%的敏感性。结论多步降维的特征提取方法可以有效降低SELDI质谱数据的特征维度,结合半监督学习算法BB-LLGC,可以获得较好的分类效果。
- 游晓璐祝磊曹凯敏韩斌
- 关键词:蛋白质质谱半监督学习特征提取