王梦婕
- 作品数:4 被引量:59H指数:3
- 供职机构:华东理工大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学医药卫生更多>>
- 基于远程监督与语法规则的症状识别方法研究
- 王梦婕
- 基于规则推理引擎的实体关系抽取研究被引量:9
- 2016年
- 实体关系抽取是指从无结构的自然语言文本中抽取实体之间的语义关系,并以结构化的形式表示出来。传统的实体关系抽取方法只注重一种特定类型的数据源,并需要标注大量的训练数据来训练抽取模型,人工成本高。因此提出了一种综合多种数据源,并结合规则推理引擎的实体关系抽取方法,准确地说就是综合结构化和非结构化两种数据源,在结构化数据提供少量种子的情况下用规则推理引擎推理出更多的实体关系。然后使用远程监督学习方法从无结构的文本中抽取实体关系,通过多次迭代获得最终的实体关系。实验结果证明了该方法的有效性。
- 薛丽娟席梦隆王梦婕王昊奋阮彤
- 关键词:关系抽取
- 垂直知识图谱的构建与应用研究被引量:44
- 2016年
- [目的/意义]近年来,知识图谱技术受到学术界和工业界的普遍关注。提出数据驱动的增量式知识图谱构建方法,为构建垂直知识图谱提供一种新思路。同时,通过3个用例研究提供垂直知识图谱的应用示范。[方法/过程]首先给出知识图谱的形式化定义,然后提出数据驱动的增量式知识图谱构建方法,重点研究构建垂直知识图谱数据图的细节与难点。基于该方法,本文构建了中医药知识图谱、海洋知识图谱和企业知识图谱。[结果/结论]以上垂直知识图谱的构建证实了本方法的可行性,它们各自的垂直应用体现了知识图谱的广泛应用。
- 阮彤王梦婕王昊奋胡芳槐
- 关键词:知识获取知识融合语义搜索
- 电子病历文本症状自动识别方法被引量:6
- 2016年
- 基于症状体系识别的难点,提出一种创新的基于症状构成模式的非监督学习方法来实现电子病历症状实体的自动抽取,介绍其总体过程并与基于CRF序列标注的监督学习方法进行比较,试验证明本文所提出的方法具有良好的识别效果和可扩展性。
- 龚凡王梦婕阮彤王昊奋陆灏
- 关键词:结构化电子病历