您的位置: 专家智库 > >

丁杰

作品数:1 被引量:7H指数:1
供职机构:北京信息科技大学更多>>
发文基金:北京市教委科技发展计划国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇种子
  • 1篇部件库
  • 1篇抽取
  • 1篇抽取方法

机构

  • 1篇北京信息科技...
  • 1篇北京城市系统...

作者

  • 1篇吕学强
  • 1篇丁杰
  • 1篇刘克会

传媒

  • 1篇计算机工程与...

年份

  • 1篇2015
1 条 记 录,以下是 1-1
排序方式:
基于边界标记集的专利文献术语抽取方法被引量:7
2015年
目前,大部分术语边界的确定方法是通过选取合适的统计量,设置合适的阈值计算字符串之间的紧密程度,但该类方法在抽取长术语时不能得到很好的效果。为了解决在术语抽取过程中长术语抽取召回率低的问题,在研究了大量专利文献的基础上,提出了一种基于专利术语边界标记集的术语抽取方法。方法中提出了边界标记集的概念,并结合专利文献中术语边界的特点构建专利术语边界标记集;提出了一种种子术语权重计算方法抽取种子术语;使用人民日报语料作为对比语料抽取专利文献术语部件词库,提高候选术语的术语度;最后采用左右边界熵的方法对识别出的术语进行过滤。实验表明,所提出的方法具有较好的实验结果,正确率81.67%,召回率71.92%,F值0.765,较对比实验有较大提高。
丁杰吕学强刘克会
关键词:部件库
共1页<1>
聚类工具0