广东省医学科学技术研究基金(B2008082)
- 作品数:2 被引量:7H指数:2
- 相关作者:李丽霞周舒冬张磊郜艳晖徐英更多>>
- 相关机构:广东药学院中山大学更多>>
- 发文基金:广东省医学科学技术研究基金更多>>
- 相关领域:医药卫生更多>>
- 基于K近邻的过抽样算法在不平衡的医学资料中的应用被引量:4
- 2008年
- 目的介绍一种基于K近邻的过抽样算法在不平衡的医学数据集分类中的应用。方法首先利用K近邻法删除在分类中容易与少数类混淆的多数类样本;再对新生成的训练集利用SMOTE算法进行少数类样本的扩充,以有效提高少数类的分类性能。结果利用社区人群的慢性阻塞性肺疾病资料验证,基于K近邻的过抽样算法的分类性能比合成少数类过抽样算法及欠抽样方法要强。结论当医学资料出现不平衡特征时,传统分类器的分类效果不佳,基于K近邻的过抽样算法能够获得良好的分类性能,在医学模式识别领域中有较好的应用前景。
- 周舒冬张磊李丽霞
- 关键词:K近邻过抽样不平衡
- 加权Fisher线性判别法在非平衡医学数据集中的应用被引量:3
- 2009年
- 目的:介绍加权Fisher线性判别法在非平衡医学数据集中的应用。方法:在两类分类问题中,当两类样本的协方差矩阵不同时,样本不平衡会导致Fisher线性判别的性能下降,使用加权Fisher线性判别法对两类样本同时进行不同倍数的过抽样,可促使两类的样本数目趋向平衡。结果:利用社区居民的血糖流行病学调查资料进行验证,加权Fisher线性判别法较传统Fisher线性判别法的灵敏度高,分类性能明显提高。结论:加权Fisher线性判别法可适用于非平衡数据集,算法简单高效,且基本不增加计算复杂度。
- 周舒冬李丽霞郜艳晖徐英叶小华张丕德
- 关键词:加权FISHER线性判别