国家自然科学基金(39970397)
- 作品数:5 被引量:26H指数:2
- 相关作者:郭政李霞傅松滨薛雅丽张瑞杰更多>>
- 相关机构:哈尔滨医科大学更多>>
- 发文基金:国家自然科学基金黑龙江省科技攻关计划国家高技术研究发展计划更多>>
- 相关领域:医药卫生更多>>
- 主成分分析与聚类分析在民族分化研究中的应用比较被引量:23
- 2002年
- 目的 比较主成分分析与聚类分析两种聚类方法对 13个人群进行分类的结果。方法 采用两种数值分类方法并用Y染色体的 12种单体型的双等位基因频率数据 ,对朝鲜族等 13个人群进行分类 ,分析群体间的关系 ,并阐明民族的起源。结果 两种分类方法得到的结果不尽相同。主成分分析可以减少无关指标的影响 ,但是在简化数据降低维数的过程中又有可能丢失信息。聚类分析充分利用原始数据信息 ,但无法排除无关指标的“噪音”干扰。结论 主成分分析与聚类分析都适宜做多维复杂数据的分类研究 ,但在实际应用中 ,应运用两种分类方法得到的结果结合领域知识给出客观、合理的结论。
- 张瑞杰郭政李霞薛雅丽傅松滨
- 关键词:主成分分析聚类分析单体型
- SAGE遗传分析系统的功能及应用被引量:3
- 2002年
- SAGE是集多功能于一体的医学遗传学群体与家系资料计算机分析系统。本文概述SAGE系统的主要功能及应用环境。重点介绍了FCOR2和TDTEX两个功能模块的数学原理和使用方法。应用TDTEX模块 ,我们发现微卫星标记 85ca与小儿失神症存在连锁不平衡 。
- 宫滨生李霞郭政
- 关键词:遗传流行病学
- Oligo基因芯片的异常值处理对有监督疾病分类的影响
- 2008年
- 基因芯片实验产生的表达谱数据中存在大量不合格的检测点,对异常值的不同处理,对于有监督疾病分类结果的影响很大。针对此问题,在Oligo芯片数据中,在表达水平层面,通常对检测值做最大值和最小值的预处理后,进行后续分析。本研究选取了四套Oligo芯片数据集,采用不同限定芯片数据中最大值和最小值的方法,考察支持向量机、K近邻、决策树三种分类器对分类疾病样本效能的影响程度。结果显示:Dudoit等限定最大值和最小值分别为16000和100是一种合理的策略,可以达到很好的分类效果。同时发现对于小于100的检测值较多的数据集,采用限定最小值为10的策略同样能得到很好的分类效果,并可以为后续分析保留更多的原始数据。因此,合理限制Oligo芯片中的异常值,对于提高疾病分型是一种较好的策略。进一步采用功能表达谱方法,构造反映功能结点中全部注释基因的总体表达状态的均值或中值指标,利用构建的功能表达谱进行分类分析。发现不同异常值的限定方法对基于功能表达谱进行分类得到的准确率的影响较小,可以获得较稳定的分类结果。
- 吕莹丽王栋郭政于梁梁李彦辉朱晶王晨光
- 关键词:基因表达谱
- 疾病遗传度估计的程序与应用
- 2001年
- 1 遗传度估计方法
若一个性状(或疾病)的表型只有两个状态(有或无),则称之为质量性状或阈值性状;若一个性状(如血压等)的表型可用一个指标连续度量时,则称之为数量性状.
- 高广信李霞郭政
- 关键词:疾病遗传度估计方法
- 通过表达谱区分基因突变类型的可行性的仿真分析
- 2002年
- 以线性状态空间模型为基础 ,对不同类型突变情况下的基因表达谱进行仿真。通过对基因进行层次聚类的方法提取表达谱的模式特征 ,将模式特征类别与基因突变类型之间进行了比较分析。结果显示 ,每一种突变类型对应一种独特的取类结果 ;聚类对象不包括突变基因时仍具特异性 ;对仿真表达谱数据加一定噪音后聚类结果仍保持较好的稳定性。
- 许杰郭政李霞
- 关键词:突变聚类分析基因芯片