江苏省高技术研究计划项目(BK2003030)
- 作品数:2 被引量:1H指数:1
- 相关作者:李培峰朱巧明司广涛李军辉更多>>
- 相关机构:苏州大学更多>>
- 发文基金:江苏省教育厅自然科学基金江苏省高技术研究计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于最大熵方法的垃圾邮件过滤插件的设计与实现
- 2007年
- 结合邮件的半结构化特征,将最大熵模型引入垃圾邮件过滤中,构造出基于最大熵模型的垃圾邮件过滤系统框架。在此基础上,将其与Outlook提供的PIA相结合,利用.NET技术开发出基于最大熵模型的垃圾邮件过滤插件,在客户端实现了基于内容的垃圾邮件过滤,较好地解决了垃圾邮件的问题。
- 司广涛朱巧明李培峰
- 关键词:最大熵模型邮件过滤NET
- 一个基于最大熵模型的文本分类方法
- 本文提出了一种应用最大熵模型进行中文文本分类的方法,该方法重点在于特征函数的构建和文本的预处理这两个方面。本文把文档的预处理分为网页去标记、分词、去虚词和去停用词四个步骤,从而使得特征项的提取更加合理。另外,本文提出了一...
- 李军辉朱巧明李培峰
- 关键词:文本分类最大熵模型文本预处理特征函数
- 文献传递
- 一种基于最大熵模型的邮件过滤方法被引量:1
- 2008年
- 根据电子邮件中正常邮件和垃圾邮件的概率特性,将在信号处理领域应用广泛的最大熵模型引入到邮件过滤中,并结合邮件的半结构化特性,形成邮件特征向量,给出传统特征函数的改进定义。在此基础上,构造出基于最大熵模型的邮件过滤方法的基本框架。实验结果表明,这种过滤方法表现出了良好的性能。
- 司广涛李培峰朱巧明李军辉
- 关键词:最大熵模型特征提取邮件过滤