ncRNA和mRNA一样,都是重要的功能分子。以k-tuple(k字)含量为特征,对酵母ncRNA成熟序列和mRNA的编码区、上游序列与下游序列进行了分类与比较研究,结果显示:基于ncRNA成熟序列与mRNA编码区的3-tuple的含量,ncRNA和mRNA的交叉有效性分类精度(leave-one out cross-validation,LOOCV)平均值达到93.93%;基于上游序列4-tuple和5-tuple的含量,分类精度分别为92.49%和92.76%;基于下游序列4-tuple和5-tuple的含量,分类精度分别为91.58%和90.60%;利用上游序列和下游序列的4-tuple与5-tuple的含量,其平均分类精度分别为94.68%和94.83%;通过t检验,得到了在ncRNA和mRNA上、下游序列中具有显著统计学差异的k-tuple。上述结果表明,基于ncRNA成熟序列与mRNA编码区的3-tuple含量和基于ncRNA与mRNA上、下游序列的4或5-tuple含量可以有效地区分ncRNA与mRNA。此研究结果不仅有助于准确识别ncRNA与mRNA,还有助于发现ncRNA特异的转录因子结合位点。
我们曾于2004年推出了计算机辅助分子生物学实验设计的软件系统B ioSun 1.0,该系统提供了较为全面的数据处理与分析功能。为了更好地服务于生物医学工作者,我们对该软件系统进行了升级,推出了2.0版本,新增的功能主要有:基于B last的多种形式的序列比对、基于C lustalW的多序列比对与进化树构建、蛋白质三维结构展示、基于RNA fold的RNA二级结构预测和序列格式转换等。通过与商业化综合性的生物信息学软件系统DNA-SIS MAX 2.05、DNAStar 5.0、Vector NTI 9.1和B ioEd it 7.0的比较发现,B ioSun2.0具有操作简便、功能众多和性价比高等特点,能够满足生物医学实验室的常规需求。