国家自然科学基金(90920010)
- 作品数:3 被引量:83H指数:3
- 相关作者:孙乐王立霞淮晓永张苇如韩先培更多>>
- 相关机构:中国科学院软件研究所中国科学院研究生院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于维基百科和模式聚类的实体关系抽取方法被引量:23
- 2012年
- 该文提出了一种基于维基百科和模式聚类的方法,旨在从开放文本中抽取高准确率的中文关系实体对。首次使用从人工标注知识体系知网到维基百科实体映射的方式获取关系实例,并且充分利用了维基百科的结构化特性,该方法很好地解决了实体识别的问题,生成了准确而显著的句子实例;进一步,提出了显著性假设和关键词假设,在此基础上构建基于关键词的分类及层次聚类算法,显著提升了模式的可信度。实验结果表明该方法有效提升了句子实例及模式的质量,获得了良好的抽取性能。
- 张苇如孙乐韩先培
- 关键词:关系抽取维基百科模式聚类
- 一种LDA模型的高效并行求解算法
- 统计主题模型是近年来在文本信息处理领域发展起来的重要方法,由于模型结构的复杂性以及所需处理数据的巨大规模,所以迫切需求该类模型的高效求解算法。本文针对隐含主题模型LDA,研究了其变分求解算法的并行化方法。首先,提出一种新...
- 李文波孙乐
- 文献传递
- 基于语义的中文文本关键词提取算法被引量:49
- 2012年
- 为克服传统关键词提取算法局限于字面匹配、缺乏语义理解的缺点,提出一种基于语义的中文文本关键词提取(SKE)算法。将词语语义特征融入关键词提取过程中,构建词语语义相似度网络并利用居间度密度度量词语语义关键度。实验结果表明,与基于统计特征的关键词提取算法相比,SKE算法提取的关键词能体现文档的主题,更符合人们的感知逻辑,且算法性能较优。
- 王立霞淮晓永
- 关键词:语义相似度中文文本
- 基于维基百科和模式聚类的实体关系抽取方法
- 本文提出了一种基于维基百科和模式聚类的方法,旨在从开放文本中抽取高准确率的中文关系实体对。首次使用从人工标注知识体系知网到维基百科实体映射的方式获取关系实例,并且充分利用了维基百科的结构化特性,我们的方法很好地解决了实体...
- 张苇如孙乐韩先培
- 关键词:关系抽取维基百科模式聚类
- 文献传递
- 用户查询意图切分的研究被引量:11
- 2013年
- 用户查询意图是指用户在构建查询时,希望搜索引擎能够返回的信息.如果搜索引擎可以判断用户当前查询与之前输入的查询是否属于同一查询意图,那么可以为用户提供更适当的查询建议、查询扩展或者个性化检索服务等.该文提出了基于点击相似度切分用户查询意图,在决策树模型和CRF模型上都取得了一定的提升.利用用户点击信息可以提高查询意图切分的效果,引入用户点击信息后,基于决策树的方法,F值提高1%,基于CRF模型的F值提高1.4%.
- 江雪孙乐
- 关键词:信息检索查询日志