您的位置: 专家智库 > >

田宝明

作品数:2 被引量:16H指数:2
供职机构:南京大学计算机科学与技术系计算机软件新技术国家重点实验室更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇文本分类
  • 2篇文本分类方法
  • 2篇类方
  • 1篇信息处理
  • 1篇语义分析
  • 1篇推式
  • 1篇谱图
  • 1篇潜在语义
  • 1篇潜在语义分析
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇计算机
  • 1篇计算机应用

机构

  • 2篇南京大学
  • 1篇南京师范大学

作者

  • 2篇戴新宇
  • 2篇陈家骏
  • 2篇田宝明
  • 1篇周俊生

传媒

  • 1篇电子学报
  • 1篇中文信息学报

年份

  • 1篇2009
  • 1篇2008
2 条 记 录,以下是 1-2
排序方式:
一种基于随机森林的多视角文本分类方法被引量:9
2009年
基于词的向量空间模型是文本分类中的传统的表示文本的方法。这种表示方法的一个缺点是忽略了词之间的关系。最近一些使用潜在主题文本表示的方法,如隐含狄利克雷分配LDA(Latent Dirichlet Allocation)引起了人们的注意,这种表示方法可以处理词之间的关系。但是,只使用基于潜在主题的文本表示可能造成词信息的损失。我们使用改进的随机森林方法结合基于词的和基于LDA主题的两种文本表示方法。对于两类特征分别构造随机森林,最终分类结果通过投票机制决定。在标准数据集上的实验结果表明,相比只使用一种文本特征的方法,我们的方法可以有效地结合两类特征,提高文本分类的性能。
田宝明戴新宇陈家骏
关键词:计算机应用中文信息处理文本分类向量空间模型
一种基于潜在语义分析和直推式谱图算法的文本分类方法LSASGT被引量:7
2008年
本文针对训练数据较少以及在基于图的分类算法中的文本表示问题,提出了一种基于潜在语义分析技术和直推式谱图算法的文本分类方法LSASGT,该方法将潜在语义分析技术和直推式谱图算法这两种基于谱分析理论的技术有机地结合在一起,对所有训练数据和测试数据进行统一建模,挖掘数据中潜在的多种结构信息.LSASGT引入潜在语义分析技术用于构造文本图表示模型,在能够反映人的分类标准的潜在语义特征空间中,描述文本之间的语义相关性;基于这样的文本表示,利用半监督的直推式谱图算法进行文本分类.在基准英文文本分类数据集Reuters21578和中文文本分类数据集Tan-Corp上的实验结果表明,本文给出的LSASGT文本分类方法获得了较好的分类结果.
戴新宇田宝明周俊生陈家骏
关键词:潜在语义分析文本分类
共1页<1>
聚类工具0