杨同峰
- 作品数:5 被引量:27H指数:2
- 供职机构:山东大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金山东省自然科学基金山东省科技计划项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 主题模型LDA的多文档自动文摘被引量:23
- 2010年
- 近年来使用概率主题模型表示多文档文摘问题受到研究者的关注.LDA(latent dirichlet allocation)是主题模型中具有代表性的概率生成性模型之一.提出了一种基于LDA的文摘方法,该方法以混乱度确定LDA模型的主题数目,以Gibbs抽样获得模型中句子的主题概率分布和主题的词汇概率分布,以句子中主题权重的加和确定各个主题的重要程度,并根据LDA模型中主题的概率分布和句子的概率分布提出了2种不同的句子权重计算模型.实验中使用ROUGE评测标准,与代表最新水平的SumBasic方法和其他2种基于LDA的多文档自动文摘方法在通用型多文档摘要测试集DUC2002上的评测数据进行比较,结果表明提出的基于LDA的多文档自动文摘方法在ROUGE的各个评测标准上均优于SumBasic方法,与其他基于LDA模型的文摘相比也具有优势.
- 杨潇马军杨同峰杜言琦邵海敏
- 关键词:多文档自动文摘主题模型LDA
- 基于主题模型LDA的多文档自动摘要
- 随着Web上文档数量的指数型增长,文档摘要起到越来越重要的作用,近年来使用概率主题模型表示多文档摘要问题受到研究者的关注。LDA(Latent Dirichlet Allocation)是主题模型中具有代表性的概率生成性...
- 杨潇马军杨同峰杜言琦邵海敏
- 关键词:多文档自动文摘主题模型LDA
- 文献传递
- 基于空间关系的图像检索与分类研究
- 随着个人媒体设备的普及和第二代互联网技术的发展,互联网中的图像数量急剧增长。如何快速有效的组织和管理这些图像成为一个研究热点。而对图像的组织和管理离不开对图像内容的理解。近些年比较热门的研究方向如图像检索,图像标注,图像...
- 杨同峰
- 关键词:图像识别图像检索
- 文献传递
- 图像中物体空间关系的表示及在检索中的应用被引量:2
- 2013年
- 基于图像中物体之间的空间关系的图像检索往往受困于待处理的图像中物体种类和空间位置难以自动准确地获取.文中基于物体识别算法的输出,提出一种对物体空间关系的三元组表示法,给出基于这种表示方法对图像索引、相似度计算和检索排序的方法及允许用户使用查询词和空间关系表达查询需求的二维输入界面,并实现原型系统.这种表示法具有良好的鲁棒性,可容忍物体识别算法一定程度的误差,将物体识别得到的置信度加入三元组表示法置信度计算和排序算法中,减少物体识别结果误差对检索性能的影响.在原型系统上的实验表明,该系统在实验中对包含物体位置关系的检索给出更准确的结果,在NDCG@m、MAP、F@m上均优于现有系统.
- 杨同峰马军
- 关键词:图像检索
- 基于主题模型LDA的多文档自动摘要
- 随着Web上文档数量的指数型增长,文档摘要起到越来越重要的作用,近年来使用概率主题模型表示多文档摘要问题受到研究者的关注。LDA(LatentDirichlet Allocation)是主题模型中具有代表性的概率生成性模...
- 杨潇马军杨同峰杜言琦邵海敏
- 关键词:LDA模型多文档自动文摘
- 文献传递