您的位置: 专家智库 > >

何建云

作品数:2 被引量:30H指数:2
供职机构:四川大学计算机学院更多>>
发文基金:国家自然科学基金国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇主题
  • 1篇文本处理
  • 1篇LDA
  • 1篇LDA模型

机构

  • 2篇四川大学

作者

  • 2篇杜敏
  • 2篇陈兴蜀
  • 2篇何建云
  • 2篇江浩
  • 1篇王海舟
  • 1篇高悦

传媒

  • 1篇华南理工大学...
  • 1篇中南大学学报...

年份

  • 1篇2016
  • 1篇2015
2 条 记 录,以下是 1-2
排序方式:
基于改进的在线LDA模型的主题演化分析被引量:15
2015年
为了解决OLDA模型中的主题混合和新主题不能及时发现的问题,基于OLDA模型提出一种改进的在线LDA模型(improved online LDA,IOLDA)。该模型根据主题强度为每个主题设置不同的遗传度,提出一种新的主题强度度量方法,根据文档-主题分布的集中程度为文档设置不同的权值,该方法可以有效降低宽泛主题的强度得分;利用模型主题对齐的特点,采用Jensen-Shannon距离横向计算话题间的关联。实验结果表明:本文提出的方法能够有效地在线分析主题的演化。
何建云陈兴蜀杜敏江浩
关键词:LDA模型
基于OLDA的热点话题演化跟踪模型被引量:18
2016年
为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现的热点话题,文中提出了基于在线LDA(OLDA)话题模型的论坛热点话题演化跟踪模型(HTOLDA),该模型只选择热点话题进行先验传递,并通过设置同一话题相邻时间片的语义距离来判断话题的状态.实验结果表明,HTOLDA模型对各个时间片的论坛数据集的建模能力优于OLDA模型,并能够有效地对论坛中的热点话题进行演化跟踪.
陈兴蜀高悦江浩杜敏王海舟何建云
关键词:文本处理
共1页<1>
聚类工具0