您的位置: 专家智库 > >

山东大学自主创新基金(11150070613165)

作品数:2 被引量:4H指数:1
相关作者:薛冉马军韩晓晖邵海敏陈竹敏更多>>
相关机构:山东大学更多>>
发文基金:山东大学自主创新基金山东省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇LDA
  • 1篇地理信息
  • 1篇语义
  • 1篇语义特征
  • 1篇视觉词
  • 1篇视觉词汇
  • 1篇主题分布
  • 1篇主题模型
  • 1篇回帖
  • 1篇WEB论坛
  • 1篇FLICKR
  • 1篇词汇

机构

  • 2篇山东大学

作者

  • 2篇韩晓晖
  • 2篇马军
  • 2篇薛冉
  • 1篇邵海敏
  • 1篇陈竹敏

传媒

  • 1篇计算机研究与...
  • 1篇中文信息学报

年份

  • 2篇2012
2 条 记 录,以下是 1-2
排序方式:
一种基于LDA的Web论坛低质量回帖检测方法被引量:4
2012年
为了过滤Web论坛中的低质量回帖,提出了一种新的基于LDA(latent Dirichlet allocation)的低质量回帖检测方法.不同于以往的方法,该方法在对回帖进行质量分类时使用了两类特征:语义特征和统计特征.提出并定义了垃圾/非重要(J/Ⅰ)主题比例、主题不确定度和主题相关度3种语义特征.为克服TF·IDF方法在表示稀疏文本语义上的局限性,语义特征在LDA主题空间上计算.另外,统计特征包括浅层特征、句法特征和论坛专有特征.由于检测回帖质量可被看作二元分类问题,训练SVM分类器来区分出低质量回帖.在3个不同数据集上的实验结果表明,新方法在精确率、查全率和F1测度上均优于已知的方法.
韩晓晖马军邵海敏薛冉
关键词:WEB论坛主题模型主题分布语义特征
基于衰退理论的Flickr热点事件检测方法
2012年
该文提出了一种基于衰退理论对Flickr数据进行热点事件检测的方法。该方法首先将从Flickr图像中提取的视觉词汇(Visual Words)与图像的文本信息加权合并成文档。然后训练LDA模型获得文档的主题分布作为其最终向量表示。在此基础上提出了一种改进的Single-Pass算法进行事件检测,该算法不仅考虑了图片的地理位置信息,而且基于衰退理论(Aging Theory)对检测到的事件进行生命周期建模,以便计算事件在每个时间段的能量值。最后,根据能量值进行事件排序,获得给定时间段内的热点事件。在真实Flickr数据集上的实验结果表明所提出的方法在精确率、召回率和F1测度上优于传统事件检测方法。
薛冉马军韩晓晖陈竹敏
关键词:视觉词汇地理信息LDA
共1页<1>
聚类工具0