项婧
- 作品数:2 被引量:12H指数:2
- 供职机构:华北计算技术研究所更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于神经网络的电子邮件分类与过滤被引量:10
- 2006年
- 现在电子邮件的应用非常广泛,已经成为人们生活中一种重要的通讯手段,但各种各样的垃圾邮件也是令我们十分困扰的问题,给出了一种电子邮件的分类过滤方法。电子邮件作为一种半结构化的文档,电子邮件信息包含了固定的语法部分和一定长度的可变文本部分,同时处理这两部分以得到更高的准确度。首先对邮件进行文本处理,得到特征向量;然后使用基于神经网络的方法对邮件进行分类过滤得到邮件分类器;最后通过实验验证分类器的有效性。
- 任劼项婧
- 关键词:电子邮件神经网络文本处理特征向量
- 决策树分类器在分析基因微阵列数据中的应用被引量:2
- 2006年
- 近年来,需要深入研究癌症细胞的基因表达技术正在不断增多。机器学习算法已经被广泛用于当今世界的许多领域,但是却很少应用于生物信息领域。系统研究了决策树的生成、修剪的原理和算法以及其它与决策树相关的问题;并且根据CAMDA2000(criticalassessmentofmicroarraydataanalysis)提供的急性淋巴白血病(ALL)和急性骨髓白血病(AML)数据集,设计并实现了一个基于ID3算法的决策树分类器,并利用后剪枝算法简化决策树。最后通过实验验证算法的有效性,实验结果表明利用该决策树分类器对白血病微阵列实验数据进行判别分析,分类准确率很高,证明了决策树算法在医学数据挖掘领域有着广泛的应用前景。
- 项婧任劼
- 关键词:决策树剪枝算法数据挖掘知识发现