泛素-蛋白酶体在真核生物的抗原呈递、细胞周期调控和转录因子激活等生理过程中发挥着极为重要的作用,其核心就是蛋白酶体对底物的选择性酶切作用,因此对选择性酶切位点的预测一直是计算生物学的一个重点研究内容.针对现有酶切位点预测方法的非线性和物理意义不明确等问题,借鉴定量构效关系研究方法,采用基于氨基酸物理化学性质的描述子——VHSE(Principal component score vector of hydrophobic,steric,and electronic properties)对收集的2650个MHC-I配体的源蛋白序列进行了结构表征,在此基础上利用支持向量机建立了蛋白酶体酶切位点的预测模型,其最优线性模型的灵敏度(Sensitivity)、特异性(Specificity)、接受者操作特征曲线下面积(area under receiver operatingcharacteristics curve,AUC)和马休斯相关系数(Matthews coefficient of correlation,MCC)分别为90.18%,69.63%,0.8797和0.6131.模型分析结果表明:影响酶切位点选择性的氨基酸性质由大到小依次为:疏水性、电性和立体特征;P9,P8,P4,P1,P3',P4'和P5'位氨基酸对酶切位点的选择有重要影响,研究亦显示酶切位点上游P1位和下游P1'~P5'的"疏水势差"有利于蛋白酶体的切割作用.
基于VHSE(Principal component score vector of hydrophobic,steric,and electronic properties)结构表征方法,采用支持向量机结合遗传算法变量筛选技术,分别建立B*5701和B*5801多肽亲和活性的分类预测模型,其最优线性模型内部验证的灵敏度(Sensitivity,Sen)、特异性(Specificity,Spe)、接受者操作特征曲线下面积(Area under receiver operating characteristics curve,AUC)和马休斯相关系数(Matthews coefficient of correlation,MCC)分别为77.29%、93.99%、93.02%、67.65%(B*5701)和78.08%、89.62%、88.34%、64.73%(B*5801);外部验证的Sen、Spe、AUC和MCC分别为80.02%、94.53%、94.62%、72.09%(B*5701)和77.43%、90.79%、87.98%、66.20%(B*5801)。依据最优模型,分别对B*5701和B*5801配体的亲和特性进行了细致的比较和分析,研究结果可为Abacavir的HLA-B*5701限制性药物毒副作用(Serious Adverse Drug Reactions,SADR)机理研究提供重要的参考依据。
随着高通量基因测序技术的发展,全基因组关联分析(genome-wide association study,GWAS)被越来越多地应用到遗传异质性药物毒副作用(adverse drug reactions,ADRs)研究中。越来越多的研究发现:遗传异质性ADRs与人类白细胞抗原(human leukocyte antigen,HLA)密切相关,如阿巴卡韦(abacavir)与HLA-B*5701、别嘌醇(allopurinol)与HLA-B*5801、卡马西平(carbamazepine)与HLA-B*1502等基因关联。针对上述基因关联现象,相继提出半抗原理论、危险因子理论、"P-I"理论以及最新提出的自身免疫机制。本文就遗传异质性ADRs与HLA基因关联及其机制研究的最新进展进行了详细综述。