张艳梅
- 作品数:3 被引量:29H指数:1
- 供职机构:南京大学更多>>
- 发文基金:江苏省普通高校研究生科研创新计划项目国家重点实验室开放基金国家级大学生创新创业训练计划更多>>
- 相关领域:自动化与计算机技术经济管理生物学更多>>
- NBS类抗病基因在被子植物中的动态演化研究
- 近年来,随着基因组测序技术的飞速发展,越来越多的植物基因组被测序。由于NBS基因在植物免疫系统中的重要作用,研究人员对二十余种植物基因组中的NBS基因进行了调查,为NBS基因的演化分析和植物抗病育种提供了丰富的信息。但是...
- 张艳梅
- 关键词:被子植物生物信息学比较基因组学
- 分类不平衡对软件缺陷预测模型性能的影响研究被引量:28
- 2018年
- 分类不平衡是指不同类别间样本数量分布不均衡的现象.在软件缺陷预测中,传统预测模型的性能可能会因数据集分类不平衡而受到影响.为了探究分类不平衡对软件缺陷预测模型性能的影响程度,该文提出一种分类不平衡影响分析方法.首先,设计一种新数据集构造算法,将原不平衡数据集转化为一组不平衡率依次递增的新数据集.然后,选取不同的分类模型作为缺陷预测模型,分别对构造的新数据集进行预测,并采用AUC指标来度量不同预测模型的分类性能.最后,采用变异系数C·V来评价各个预测模型在分类不平衡时的性能稳定程度.在8种典型的预测模型上进行实验验证,结果表明C4.5、RIPPER和SMO这3种预测模型的性能随着不平衡率的增大而下降,而代价敏感学习和集成学习能够有效提高它们在分类不平衡时的性能和性能稳定程度.与上述3种模型相比,逻辑回归、朴素贝叶斯和随机森林等模型的性能更加稳定.
- 于巧姜淑娟张艳梅张艳梅王兴亚钱俊彦
- 关键词:软件缺陷预测不平衡率代价敏感学习