姜沛佩
- 作品数:4 被引量:12H指数:2
- 供职机构:山东省分布式计算机软件新技术重点实验室更多>>
- 发文基金:国家自然科学基金山东省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 向量空间模型中结合句法的文本表示研究被引量:6
- 2011年
- 为增强向量空间模型(VSM)中项的语义描述性,克服VSM中各语义单元相互独立的缺陷,提出一种基于短语的特征粒度描述方法。该方法从文本的表示及特征项之间的组织方式入手,通过句法规则识别基本短语,构建特征与中心动词的关系树,利用基本短语代替BOW中的词。实验结果表明,采用基本短语的文本表示可提高分类的性能,增加项之间的联系,克服特征项相互独立的缺陷,在特征数量较少的情况下仍能保持良好的分类效果。
- 杨玉珍刘培玉姜沛佩
- 关键词:短语句法规则关系树文本表示
- 基于遗传禁忌算法的网络信息过滤模型研究
- 随着 Internet的发展和应用,网上信息飞速增长,内容丰富,种类繁多。然而,网络是把双刃剑,在给人类带来便利的同时又不可避免地使其接触到大量不良信息;另外,基于网络自身所固有的开放性、动态性和异构性,用户很难准确快速...
- 姜沛佩
- 关键词:信息过滤遗传禁忌算法朴素贝叶斯词法分析文本摘要
- 一种新的应用于文本特征子集优化的GATS算法被引量:3
- 2009年
- 针对文本分类中特征子集优化问题,将禁忌搜索算法引入到遗传算法中对遗传算法的核心算子———交叉算子进行改进形成禁忌交叉算子,改进后的算法称为GATS(遗传禁忌搜索算法),并将其应用在文本分类中来实现空间降维。实验证明,应用此方法进行文本特征项的选取不仅能够保持GA和TS算法本身的优点,还能在一定程度上提高文本分类的准确率。
- 姜沛佩刘培玉
- 关键词:遗传算法禁忌搜索
- 一种改进的基于遗传禁忌优化的NB算法被引量:2
- 2010年
- 针对传统朴素贝叶斯分类模型应用过程中存在的特征项冗余问题,使用遗传禁忌算法对特征项集进行优化,并在此优化结果的基础上,提出了一种改进的朴素贝叶斯分类方法来解决用户模板中存在的单类别词汇问题。经实验证明,该方法比传统的朴素贝叶斯分类模型具有更好的鲁棒性和分类性能。
- 姜沛佩刘培玉杨玉珍
- 关键词:文本分类遗传算法禁忌算法朴素贝叶斯