翁建洪
- 作品数:6 被引量:8H指数:2
- 供职机构:东南大学生物科学与医学工程学院生物电子学国家重点实验室更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:生物学医药卫生农业科学更多>>
- 基因调控数据自动处理系统的设计及实现
- 2005年
- 随着人类基因组测序工作的完成,产生了大量的生物数据,这些数据以不同的形式分布在世界各地。为使基因调控和表达信息相关联,建立了基因调控信息集成数据库系统。由于数据来源分布广泛且数据格式不统一,影响了数据库的数据集成。此研究使用了网络智能代理的相关技术,自动下载Web数据,并且进行处理,从中提取出启动子、调控因子、结合位点等有效数据。本程序大大减轻了将网络数据集成到本地数据库的负担。
- 李石法吴俊夏小俊翁建洪孙啸
- 关键词:基因调控启动子
- 基于支持向量机的细菌基因组水平转移基因预测被引量:4
- 2007年
- 随着各种生物基因组序列测定工作的完成,大量的DNA序列数据涌现出来,为研究在基因组中寻找水平转移基因提供了极大的便利.将基因序列特征分析和支持向量机技术结合起来,通过分析基因序列的特征差异发现水平转移基因.依据以前研究工作的基础,选取了绝对密码子使用频率(FCU)作为序列特征,主要因为它既包含了基因密码子使用偏性的信息,也包含了基因所编码蛋白的氨基酸组成信息,支持向量机利用这些信息进行水平转移基因分析和预测,可以提高预测的准确性.另外,提出了基于分链的水平转移基因预测新方法,即将细菌基因组前导链和滞后链上的基因区别对待,分别进行水平转移基因预测.结果显示,基本预测方法要优于目前预测结果最好的Tsirigos等提出的基于八联核苷酸频率的打分算法,命中率的相对提高率最高达31.47%,而基于分链的方法对水平转移基因的预测取得了更好的结果.
- 吴建盛谢建明周童翁建洪孙啸
- 关键词:细菌基因组支持向量机
- 细菌基因组水平转移基因预测
- 随着对各种生物的基因组序列测序工作的完成,大量的DNA序列数据涌现出来,为研究在基因组中寻找水平转移基因提供了极大的便利。本文中,我们对三种细菌基因组模拟插入一些水平转移基因,通过提取基因密码子使用个数的序列特征,使用支...
- 吴建盛李菊荣周豪彦周童翁建洪孙啸
- 关键词:细菌基因组支持向量机
- 文献传递
- 基于支持向量机的siRNA降解效率预测(英文)被引量:2
- 2006年
- 为了辅助siRNA的设计,从已发表文献中共收集到573个siRNA的实验数据,使用基于统计学习理论的支持向量机(SVM)方法,提取了siRNA序列的碱基对关联性(BBC)特征,然后使用十倍交叉验证方法,对siRNA沉默目标基因的效率进行了预测.结果表明,基于支持向量机,选用多项式核作为核函数的算法具有最高的AUC值(0.73,ROC曲线图)和最高的r值(0.43,Pearson相关系数分析),优于以前基于打分的算法.结果说明,在以后的siRNA的设计中应该更多关注碱基之间的关联信息.
- 吴建盛胡敏菁周童翁建洪江澎孙啸
- 关键词:SIRNA支持向量机ROC曲线
- 支持向量机在生物信息学中的应用
- 随着后基因组时代的到来,使用机器学习方法对生物数据进行数据挖掘已经成为生物学研究的一种新方法,本课题主要利用新近提出的支持向量机算法,结合生物序列的特征提取(如经典的密码子使用偏性分析理论,理化性质等),解决生物信息学中...
- 翁建洪
- 关键词:生物信息学支持向量机密码子G蛋白偶联受体小干涉RNA
- 文献传递
- 基于支持向量机的酵母重组热点和冷点的预测(英文)
- 2006年
- 使用基于统计学习理论的支持向量机(SVM)方法,提出了针对重组热点和冷点分类预测的新方法.对酵母基因组的303个重组热点开放阅读框(hot ORF)以及48个重组冷点开放阅读框(cold ORF),提取了序列的一般二联碱基丰度特征,以及基于密码子使用偏性的二联碱基丰度特征,然后使用二倍交叉验证方法,选择不同的核函数和对应参数,对数据集进行了训练和分类预测.研究结果表明,当使用径向基核函数,并采用基于密码子使用偏性的二联碱基丰度特征时,预测准确率为87·47%.
- 翁建洪周童孙啸陆祖宏
- 关键词:冷点支持向量机