国家自然科学基金(60801060) 作品数:7 被引量:4 H指数:1 相关作者: 孔薇 宋红胜 陶伟杰 卢晓丽 宋沂鹏 更多>> 相关机构: 上海海事大学 更多>> 发文基金: 国家自然科学基金 上海市教育委员会创新基金 上海市青年科技启明星计划 更多>> 相关领域: 自动化与计算机技术 生物学 化学工程 更多>>
基于小波包-FastICA在阿尔茨海默症中的应用及其生物学分析 2012年 阿尔茨海默症(Alzheimer's disease,AD)基因表达谱数据具有高维性、高噪声、高冗余性等特点,使得AD特异性基因的搜索空间巨大,搜索算法时间长,降低了算法的挖掘性能及其生物学分析。因此对其基因表达谱数据进行去噪和降维预处理是十分必要的。文中首先利用小波包变换-SAM方法对数据进行降维去噪,实验结果证明了小波包方法能较好地提取基因表达谱有用信息;然后应用快速独立成分分析(FastICA)算法对预处理后的数据进行矩阵分解分析,并根据独立分量选取特异性基因。在此基础上的样本分类实验表明,FastICA提取的特异性基因具有较高的显著性,能够提高样本的分类结果。同时,通过所提取特异性基因的富集性分析,文中给出了这些基因在阿尔茨海默症数据集中聚类情况及其基因表达情况,为AD的生物学及医学病理分析提供有利的依据。 宫晓娜 孔薇关键词:小波包变换 SAM FASTICA 特异性基因 改进的非负矩阵分解在基因表达数据中的应用 2010年 对非负矩阵分解算法的发展历史做了简要综述,并介绍了非负矩阵分解算法的基本原理,及一种改进的非负矩阵分解算法,并将此方法应用于一组阿尔茨海默症微阵列数据的聚类中,将此结果与传统的非负矩阵分解算法进行了比较,证明了算法的有效性。 李巧 孔薇关键词:非负矩阵分解 基因表达数据 阿尔茨海默症 基于ICA的AD样本的相关基因研究 2010年 为了克服每次运行独立成分分析算法(Independent Component Analysis,ICA)所得到不同的ICs对最后所选择的AD基因造成的不良影响,提出了一种应用ICA选择基因的改进方法。首先运行多次ICA算法,然后通过比较相关系数选出与AD相关的ICs,最后依据基因出现的频数选择相关基因。通过该方法寻找到39个在每个与AD相关的ICs中都过表达的基因,且其中有一个基因位于X染色体上,通过理论分析和实验结果表明该算法的确是一种可行性的方法。 宋沂鹏 孔薇 夏斌关键词:阿尔茨海默症 基因芯片 微阵列数据 基于EFICA的AD微阵列数据基因网络分析 2012年 将EFICA(Efficient Variant of Algorithm FastICA)方法与基因网络相结合分析一组阿尔茨海默病(AD)微阵列数据.根据分类结果提取特征基因集并探寻与早期AD相关的基因网络,实验结果表明,EFICA方法比传统的Fastica方法能够获得更好的分类效果.并且通过对基因网络的研究,扩展了EFICA在生物信息学中的应用,为AD疾病的进一步研究提供新思路. 孔薇 宋红胜关键词:阿尔茨海默症 基因网络 基于Alpha-NMF的AD样本分类及特异性基因选择方法 2012年 由于基因表达谱数据的高噪声、高维性、高冗余以及数据分布不均匀等特点使得在分析过程中仍然有很多挑战性问题。基于该目的,将一种无监督学习方法--非负矩阵分解方法,应用到基因表达谱数据中,挖掘出与AD相关的信息基因。然而标准NMF算法其效率较低,并且在基因表达数据的应用有效性低。为了适应该领域的需求,采用了Alpha-NMF算法。该算法能够有效的克服标准NMF算法的缺陷,获得较好的实验结果。多次运行Alpha-NMF算法,选取分类准确率和稳定性最优的实验结果,对其集合基因设定一阈值,筛选出集合基因中大于该阈值的信息基因。最后通过基因功能分类以及生物功能结构图来验证所提炼出的特异性基因的有用性和可靠性。 卢晓丽 孔薇关键词:无监督学习 阿尔茨海默病 基于NMF技术探寻早期AD基因表达调控网络 被引量:3 2012年 利用非负矩阵分解(NMF)技术,依据加强算法的稀疏性对患早期阿尔茨海默症(AD)样本的基因表达数据进行分析,提取对疾病早期诊断具有重要意义的显著基因,样本分类实验结果证明了算法的有效性.在此基础上,结合与炎症反应有重要关系的NF-κB等基因初步建立了与早期AD密切相关的基因表达调控网络结构图,为AD致病机理的探询、早期诊断与治疗等提供了有益的途径和方法. 陶伟杰 孔薇关键词:非负矩阵分解 阿尔茨海默症 基于集成分量的基因微阵列数据分类方法的研究 被引量:1 2012年 构造高精度分类模型是对基因表达谱数据分析的主要研究方向之一,但提取不同特征空间产生的分类效果有很大差异,而集成分类系统在一定程度上提高了分类结果的可靠性和稳定性。构建基于PCA和NMF集成分量系统,并基于分析混合矩阵A的hinton图生物学意义建立集成独立分量选择系统,成功运用到基因表达谱分析,实验结果表明,集成分量分类系统优于单个分类器。 宋红胜 孔薇关键词:微阵列数据 NMF ICA