您的位置: 专家智库 > >

向河林

作品数:3 被引量:3H指数:1
供职机构:复旦大学计算机科学技术学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 3篇语义分析
  • 3篇潜在语义
  • 3篇潜在语义分析
  • 3篇聚类
  • 3篇聚类算法
  • 2篇信息检索
  • 2篇向量
  • 2篇向量空间
  • 2篇向量空间模型
  • 1篇语义
  • 1篇语义检索
  • 1篇奇异值
  • 1篇奇异值分解
  • 1篇链接
  • 1篇链接聚类
  • 1篇查询
  • 1篇查询扩展

机构

  • 3篇复旦大学

作者

  • 3篇向河林
  • 2篇李珀瀚
  • 2篇何震瀛
  • 1篇汪卫
  • 1篇张明西

传媒

  • 1篇计算机研究与...
  • 1篇计算机工程

年份

  • 1篇2012
  • 2篇2011
3 条 记 录,以下是 1-3
排序方式:
结合聚类的潜在语义检索算法研究
潜在语义分析(LatentSemanticAnalysis,LSA)是一种通过统计分析挖掘出文档和词语之间潜在含义的经典算法,最初用于解决信息检索中的多义词问题。潜在语义分析使用传统的向量空间模型来表示词语和文档之间的关...
向河林
关键词:潜在语义分析语义检索信息检索向量空间模型奇异值分解
文献传递
一种基于链接聚类的查询扩展算法被引量:2
2011年
潜在语义分析(LSA)是一种用于自动实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从其中挖掘出词语之间的潜在联系.LSA有效地解决了一义多词的问题,但是,由于LSA在大矩阵的计算效率和存储上的不足,这限制了LSA在大规模数据集上的应用.另一方面,在关系数据库中,数据对象通过多种类型的链接连接到一起.这些链接中蕴藏了丰富的语义信息.数据对象之间的相似性也可以通过这些链接体现出来.针对这个特点,提出了一种基于链接聚类的查询算法:利用数据对象之间的链接对数据对象进行聚类,用聚类代替文档来进行LSA处理,有效地减少处理文档的个数;在检索的过程中,寻找与关键字序列相似度最接近的簇,然后将簇内的文档返回给用户.实验结果表明,所提出的方法能够充分利用数据对象之间的链接,聚类效果明显;利用聚类后进行LSA处理,能够成倍地提高空间和时间开销,对精确度有提高作用.
李珀瀚何震瀛向河林
关键词:潜在语义分析查询扩展
一种基于聚类的语义检索算法被引量:1
2012年
潜在语义分析在进行大规模语义检索时计算效率较低、存储开销较大。针对该问题,提出一种基于聚类的潜在语义检索算法。通过文档之间的结构关系对文档进行聚类,利用簇代替文档分析潜在语义,以此减少处理文档的个数。实验结果表明,该算法能减少查询时间,且检索精确度较高。
向河林张明西李珀瀚何震瀛汪卫
关键词:潜在语义分析信息检索向量空间模型
共1页<1>
聚类工具0