您的位置: 专家智库 > >

邵海敏

作品数:5 被引量:27H指数:2
供职机构:山东大学计算机科学与技术学院更多>>
发文基金:山东省自然科学基金国家自然科学基金山东省科技计划项目更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 4篇自动化与计算...
  • 1篇文化科学

主题

  • 4篇多文档
  • 4篇主题模型
  • 4篇文档
  • 4篇LDA
  • 3篇多文档自动文...
  • 3篇自动文摘
  • 3篇文摘
  • 2篇多文档自动摘...
  • 2篇LDA模型
  • 1篇语义
  • 1篇语义特征
  • 1篇预测函数
  • 1篇生成性
  • 1篇搜索
  • 1篇搜索算法
  • 1篇主题分布
  • 1篇回帖
  • 1篇WEB论坛
  • 1篇成性

机构

  • 5篇山东大学
  • 1篇山东经济学院

作者

  • 5篇邵海敏
  • 4篇马军
  • 3篇杜言琦
  • 3篇杨同峰
  • 3篇杨潇
  • 1篇韩晓晖
  • 1篇薛冉

传媒

  • 1篇计算机研究与...
  • 1篇智能系统学报
  • 1篇第五届全国信...
  • 1篇第五届全国信...

年份

  • 1篇2012
  • 1篇2011
  • 1篇2010
  • 2篇2009
5 条 记 录,以下是 1-5
排序方式:
基于主题模型LDA的多文档自动摘要
随着Web上文档数量的指数型增长,文档摘要起到越来越重要的作用,近年来使用概率主题模型表示多文档摘要问题受到研究者的关注。LDA(LatentDirichlet Allocation)是主题模型中具有代表性的概率生成性模...
杨潇马军杨同峰杜言琦邵海敏
关键词:LDA模型多文档自动文摘
文献传递
主题模型LDA的多文档自动文摘被引量:23
2010年
近年来使用概率主题模型表示多文档文摘问题受到研究者的关注.LDA(latent dirichlet allocation)是主题模型中具有代表性的概率生成性模型之一.提出了一种基于LDA的文摘方法,该方法以混乱度确定LDA模型的主题数目,以Gibbs抽样获得模型中句子的主题概率分布和主题的词汇概率分布,以句子中主题权重的加和确定各个主题的重要程度,并根据LDA模型中主题的概率分布和句子的概率分布提出了2种不同的句子权重计算模型.实验中使用ROUGE评测标准,与代表最新水平的SumBasic方法和其他2种基于LDA的多文档自动文摘方法在通用型多文档摘要测试集DUC2002上的评测数据进行比较,结果表明提出的基于LDA的多文档自动文摘方法在ROUGE的各个评测标准上均优于SumBasic方法,与其他基于LDA模型的文摘相比也具有优势.
杨潇马军杨同峰杜言琦邵海敏
关键词:多文档自动文摘主题模型LDA
摘录式多文档摘要技术的研究
随着网络的发展,信息获取变得越来越容易,人们日常所需要处理的信息量也越来越大。如何从众多的文档中提取出重要的信息,以帮助人们做快速的浏览和撷取,是一项迫切的任务。多文档摘要技术因此而成为了最近几年的研究热点。   本文...
邵海敏
关键词:LDA模型搜索算法
一种基于LDA的Web论坛低质量回帖检测方法被引量:4
2012年
为了过滤Web论坛中的低质量回帖,提出了一种新的基于LDA(latent Dirichlet allocation)的低质量回帖检测方法.不同于以往的方法,该方法在对回帖进行质量分类时使用了两类特征:语义特征和统计特征.提出并定义了垃圾/非重要(J/Ⅰ)主题比例、主题不确定度和主题相关度3种语义特征.为克服TF·IDF方法在表示稀疏文本语义上的局限性,语义特征在LDA主题空间上计算.另外,统计特征包括浅层特征、句法特征和论坛专有特征.由于检测回帖质量可被看作二元分类问题,训练SVM分类器来区分出低质量回帖.在3个不同数据集上的实验结果表明,新方法在精确率、查全率和F1测度上均优于已知的方法.
韩晓晖马军邵海敏薛冉
关键词:WEB论坛主题模型主题分布语义特征
基于主题模型LDA的多文档自动摘要
随着Web上文档数量的指数型增长,文档摘要起到越来越重要的作用,近年来使用概率主题模型表示多文档摘要问题受到研究者的关注。LDA(Latent Dirichlet Allocation)是主题模型中具有代表性的概率生成性...
杨潇马军杨同峰杜言琦邵海敏
关键词:多文档自动文摘主题模型LDA
文献传递
共1页<1>
聚类工具0