江苏省高校自然科学研究项目(04kjb520096)
- 作品数:1 被引量:17H指数:1
- 相关作者:徐宝文徐峻岭张卫丰崔自峰更多>>
- 相关机构:东南大学南京邮电大学更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金国家杰出青年科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种近似Markov Blanket最优特征选择算法被引量:17
- 2007年
- 特征选择可以有效改善分类效率和精度,传统方法通常只评价单个特征,较少评价特征子集.在研究特征相关性基础上,进一步划分特征为强相关、弱相关、无关和冗余四种特征,建立起Markov Blanket理论和特征相关性之间的联系,结合Chi-Square检验统计方法,提出了一种基于前向选择的近似Markov Blanket特征选择算法,获得近似最优的特征子集.实验结果证明文中方法选取的特征子集与原始特征子集相比,以远小于原始特征数的特征子集获得了高于或接近于原始特征集的分类结果.同时,在高维特征空间的文本分类领域,与其它的特征选择方法OCFS,DF,CHI,IG等方法的分类结果进行了比较,在20Newsgroup文本数据集上的分类实验结果表明文中提出的方法获得的特征子集在分类时优于其它方法.
- 崔自峰徐宝文张卫丰徐峻岭
- 关键词:MARKOVBLANKET