四川省青年软件创新工程基金(2007AA42)
- 作品数:5 被引量:7H指数:1
- 相关作者:林伟柳荣其徐熙更多>>
- 相关机构:四川警察学院西华大学更多>>
- 发文基金:四川省青年软件创新工程基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于贝叶斯分类的邮件过滤系统研究与实现被引量:1
- 2012年
- 电子邮件的普及给人们的生活带来极大的方便,但目前垃圾邮件的泛滥严重影响了用户的正常使用。贝叶斯算法因简单在英文邮件过滤中取得了良好的过滤效果,分析了贝叶斯算法的原理及其在垃圾邮件过滤中的应用,给出垃圾邮件过滤的整个过滤流程,设计并实现了一种语言无关的垃圾邮件过滤系统。
- 林伟
- 关键词:贝叶斯算法垃圾邮件
- 邮件过滤中一种改进的特征选择方法研究被引量:1
- 2009年
- 特征选择是基于内容的垃圾邮件过滤的重要过程,它有效地改善过滤效率和精度。文中分析了IG和CHI应用到垃圾邮件过滤中存在的不足,设计了一种改进的评价函数。而由于这种评价函数的特征选择方法只度量了特征与类的关系,忽略了特征之间依赖的关系,因此进一步用基于互信息的聚类方法来消除特征间冗余。实验结果表明该特征选择方法有效地提高了邮件过滤的性能。
- 林伟柳荣其徐熙
- 关键词:邮件过滤信息增益聚类
- 一种中文邮件过滤网关的设计与实现
- 2012年
- 目的设计一个基于SMTP的、位于邮件服务器前端的、对用户和管理员透明的垃圾邮件过滤网关,有效解决垃圾邮件泛滥。方法通过邮件预处理模块、过滤模块、管理模块完成整个过滤网关的设计与实现。结果与结论实验结果表明,本系统具有较好的过滤效果及过滤性能。并且本系统不直接依赖具体的邮件系统,能够和不同邮件系统实现简单集成,具有较强的可移植性。
- 林伟
- 关键词:垃圾邮件过滤网关
- 一种基于N-Gram的垃圾邮件过滤方法研究被引量:5
- 2010年
- 为了能够有效提取邮件样本集的特征及提高垃圾邮件过滤系统的性能,介绍基于N-Gram的切分算法及语言模型,在其基础上,提出了一种改进的N-Gram切分算法,给出了一种结合N-Gram语言模型的贝叶斯过滤模型。实验结果表明,提出的方法有效地提高了垃圾邮件过滤的性能。
- 林伟柳荣其徐熙
- 关键词:邮件过滤贝叶斯模型
- 一种基于成词概率的贝叶斯垃圾邮件过滤方法
- 2011年
- 贝叶斯分类方法在英文邮件过滤中效果良好,在中文环境下一直表现不佳,而特征选择是垃圾邮件过滤中的重要步骤,它能够有效地改善过滤效果。文中以成词概率作为特征选择的基础,用构造的方法形成候选特征集,然后进一步用信息增益的方法来度量特征与类的关系,选择信息增益较大的N个特征做为最后的特征向量空间。在此基础上利用贝叶斯方法对邮件进行分类,实验结果验证了该方法在分类时间和分类效果上都优于传统的基于机械分词的贝叶斯方法。
- 林伟
- 关键词:垃圾邮件贝叶斯方法