黎佳
- 作品数:3 被引量:3H指数:1
- 供职机构:江西师范大学计算机信息工程学院更多>>
- 发文基金:江西省自然科学基金国家自然科学基金江西省教育厅青年科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于特征加权的半监督聚类研究
- 2011年
- 目前在半监督聚类的研究中,尤其是当有类标信息的类的数量少于整个数据集的类的数量时,其聚类效果并不好。本文在现有半监督聚类技术的基础上,通过特征加权来提高同一类文档的相似性,从而得到更好的聚类效果。为了验证这一思想的有效性,实验不仅在单语言数据集上进行,还在中、英双语数据集上进行了只包含中文或英文类标时的聚类实验。实验结果表明,该方法体现出良好的性能。
- 黎佳王明文何世柱柯丽
- 关键词:特征加权多语言半监督聚类
- 基于频率共现熵的跨语言网页自动分类研究被引量:3
- 2011年
- 研究了基于频率共现熵的跨语言网页自动分类问题,使用翻译软件将所有中文网页翻译为英文,计算中文和英文网页的共现特征频率共现熵值,确定中文和英文网页的共现知识,并与英文网页相结合训练中文分类模型.实验结果表明,该方法与贝叶斯分类模型、向量空间分类模型和信息瓶颈模型相比体现出良好的性能.
- 柯丽王明文何世柱黎佳罗远胜
- 关键词:跨语言网页分类贝叶斯分类
- 基于特征加权的半监督文本聚类研究
- 随着计算机技术和信息网络技术的发展,社会信息量急剧增加,数据库的规模日益扩大,数据库的数据总量及容量也急剧膨胀,这些广阔的领域为聚类分析方法的应用以及聚类分析的研究提供了宽广的舞台。在很多实际应用中,我们在得到数据的同时...
- 黎佳
- 关键词:半监督聚类特征加权文本聚类