刘莉莉
- 作品数:2 被引量:3H指数:1
- 供职机构:北京理工大学信息与电子学院更多>>
- 发文基金:国家242信息安全计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 融合C4.5与SVM算法的汉语句义类型识别方法被引量:1
- 2012年
- 选择50个词法和句法特征,进行了大量特征筛选实验,并基于筛选后的特征组合提出了一种融合C4.5和SVM的句义类型识别方法.该方法充分利用C4.5对多重句义的高精度识别和SVM对简单句义、复杂句义的高精度识别的特点,将C4.5与SVM分别识别的结果进行融合处理.给出最终的句义类型识别结果.识别结果表明,在BFS-CTC汉语标注语料库中,选取了4 500个句子,经十折交叉验证,句义类型的识别准确率达到92.1%.
- 罗森林王倩刘莉莉韩磊
- 关键词:自然语言处理语义分析
- 基于概念簇的文本向量构建方法被引量:2
- 2010年
- 为提高文本向量对文本概念的逼近程度,通过将具有相同语法语义特征的词进行聚类,提取概念簇,利用空间变换将文本向量由词空间变换到概念簇空间上来表达文本。实验比较了基于TF-IDF、IG、TF-IDF-IG、LSA以及它们结合概念簇后对文本分类的效果,证明了基于概念簇的文本向量构建方法能提高文本向量对文本概念逼近的准确程度,同时也提高了不同类型文本之间的区分度。
- 冯扬罗森林潘丽敏刘莉莉陈开江
- 关键词:中文信息处理文本向量文本分类