王华
- 作品数:4 被引量:0H指数:0
- 供职机构:大连交通大学理学院更多>>
- 发文基金:辽宁省教育厅高等学校科学研究项目更多>>
- 相关领域:生物学经济管理更多>>
- 全β类蛋白编码序列的LZ复杂度对蛋白质折叠速率的影响
- 2016年
- 蛋白质折叠速率预测问题是计算生物学和生物信息学中的核心问题之一.科研工作者相继提出了许多参数和方法来探索折叠速率的决定因素.但蛋白质编码序列复杂度信息对蛋白质折叠速率的影响未被提及.提取编码序列LZ复杂度信息,融合多特征信息,建立线性回归模型进行折叠速率预测.该方法能在不需要结构信息的情况下,直接从蛋白质的编码序列出发对全β类蛋白质进行折叠速率进行预测.在卡方检验方法的验证下,发现折叠速率的预测值与实验值有很好的相关性,相关系数能达到0.9712.这一精度明显优于其他基于序列的方法,充分说明序列LZ复杂度是一个有效特征信息,蛋白质编码序列LZ复杂度信息确实影响蛋白质折叠速率及其结构.
- 白凤兰王华王雅男单婷
- 关键词:蛋白质折叠相关系数
- 基于序列特征组合与核非线性回归预测蛋白质折叠速率
- 2017年
- 选取可压缩性、LZ复杂度等特征值,将它们和20种氨基酸属性C_a,K^0,P_β,R_a,ΔASA,PI,H_t,M_μ,Esm进行组合,表征蛋白质序列.建立多元核非线性回归模型,用核非线性回归模型计算了83个蛋白质的折叠速率预测值.由Jack-knife检验方法得知在不同的结构中不同组合特征值与相应折叠速率有较好的相关性.实验结果表明:多元核非线性回归模型其预测精度及可行性高于线性回归模型,计算复杂度低和方便易操作等优点,具有良好的应用前景.
- 王雅男白凤兰刘立伟王华
- 关键词:蛋白质序列相关系数
- 基于傅里叶功率谱的H1N1病毒血凝素蛋白质序列的比较分析
- 2018年
- 基于经典的HP模型,将不同特征下的H1N1病毒血凝素蛋白质序列转换为数字序列并且用离散傅里叶变换求出相应序列的功率谱。根据这些功率谱建立数学矩函数,并将数字序列转换为多维的矩向量,得到蛋白质序列对应的特征向量。再利用特征向量之间的中间距离对蛋白质序列进行聚类比较分析,得到了较好的结果。这一方法将不同长度的蛋白质序列通过功率谱和力矩将其转化为相同维数的向量,使我们更加容易比较分析生物序列。
- 王华白凤兰刘立伟
- 关键词:蛋白质序列傅里叶变换功率谱聚类
- 基于因子模型对G蛋白偶联受体序列进行聚类
- 2017年
- G蛋白偶联受体(G Protein-Coupled Receptors, GPCRs)是一肽类膜蛋白家族,对GPCRs序列进行聚类分析有着重要的理论意义和应用价值。本文根据氨基酸的分类及其物化性质给出了蛋白质序列的特征向量表示,在此基础上用因子分析法对蛋白质序列的特征向量进行降维得到了因子模型,进而利用因子模型分析了40个GPCRs序列的相似性,并进行聚类分析,得到了较好的结果,为分析比较GPCRs序列提供新的手段。
- 王华白凤兰刘立伟
- 关键词:蛋白质序列特征向量聚类分析