樊艳
- 作品数:2 被引量:2H指数:1
- 供职机构:华东师范大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于深度学习的跨领域跨语言知识获取
- 随着互联网上信息的生产与积累,如何从大量纯文本中获取高质量的结构化知识,是目前自然语言处理的研究热点。通用领域的知识注重广度,在搜索引擎的查询理解、智能问答的推理等领域已经有广泛应用。然而,由于长尾效应的影响,通用知识在...
- 樊艳
- 中文分类体系的构建与查询系统
- 2016年
- 针对中文语言环境中缺少分类体系,无法明确实体类别并建立语义关系的问题,基于维基百科,提出一种混合架构,构建了大规模中文分类体系及其展示查询系统(CTCS2)。CTCS2包括两个模块:离线模块和在线模块。离线模块又分为SVM底层关系抽取子模块、顶层分类树构建子模块两部分。首先,采用SVM分类模型抽取语义关系,明确实体类别;然后,通过启发式规则、关联规则挖掘的方式挖掘上层抽象概念关系;其次,使用自底向上的算法从独立的关系中生成完整的中分分类体系,以分类树的形式展现;最后,在线模块分析展示了生成的分类树,并提供语义查询。实验表明,生成的语义关系的准确率高达95%;为评估分类体系包含中文知识的独特性,使用映射的方法生成YAGO的中文版本,YAGO-C,与之相比,CTCS2中仅有47.15%的实体被英文版本覆盖,说明了CTCS2的中文独特性。CTCS2为实体明确了类别类型、在类别类型间建立了语义关系,为构建中文知识图谱提供了基础的语义支持。
- 李金洋王燕华樊艳汪诚愚张蓉何晓丰
- 关键词:知识图谱支持向量机启发式规则维基百科