您的位置: 专家智库 > >

李彦鹏

作品数:12 被引量:53H指数:4
供职机构:大连理工大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术医药卫生更多>>

文献类型

  • 8篇期刊文章
  • 3篇会议论文
  • 1篇学位论文

领域

  • 11篇自动化与计算...
  • 1篇医药卫生

主题

  • 8篇文本挖掘
  • 5篇关系抽取
  • 5篇抽取
  • 4篇蛋白质关系抽...
  • 4篇生物医学
  • 4篇条件随机域
  • 3篇信息抽取
  • 3篇向量
  • 3篇命名实体识别
  • 2篇多核
  • 2篇多核学习
  • 2篇生物医学文献
  • 2篇文本分类
  • 2篇向量机
  • 2篇泛化
  • 1篇药名
  • 1篇语义
  • 1篇语义特征
  • 1篇支撑向量
  • 1篇支撑向量机

机构

  • 12篇大连理工大学
  • 2篇山东省农业管...
  • 1篇大连民族学院
  • 1篇朝阳师范高等...

作者

  • 12篇李彦鹏
  • 11篇林鸿飞
  • 10篇杨志豪
  • 2篇唐利娟
  • 1篇唐楠
  • 1篇胡运翠
  • 1篇夏佞
  • 1篇孟佳娜
  • 1篇谢冬
  • 1篇洪莉
  • 1篇王艳华
  • 1篇何林娜

传媒

  • 3篇计算机工程
  • 1篇江西师范大学...
  • 1篇广西师范大学...
  • 1篇大连理工大学...
  • 1篇中文信息学报
  • 1篇智能系统学报
  • 1篇第三届学术计...

年份

  • 1篇2014
  • 1篇2013
  • 4篇2011
  • 1篇2010
  • 3篇2008
  • 2篇2006
12 条 记 录,以下是 1-10
排序方式:
基于条件随机域的生物医学命名实体识别
命名实体识别是生物医学文献文本挖掘重要的第一步.近年有很多人研究,然而效果并不理想.JNLPBA2004测评中最好的系统只能达到72.6%的F-score.本文使用条件随机域(Conditional Random Fie...
李彦鹏杨志豪林鸿飞
关键词:命名实体识别生物医学文本挖掘条件随机域
文献传递
基于编辑距离和多种后处理的生物实体名识别被引量:2
2008年
基于编辑距离和多种后处理的生物医学文献实体名识别方法通过"全称缩写对识别算法"扩充词典,利用编辑距离算法提高识别召回率。在后处理阶段,使用前后缀词扩展、POS扩展、合并邻近实体及利用上下文线索等方法进一步提高性能。实验结果表明,使用该方法即使利用内部词典也可以获得较好的识别效果。
杨志豪林鸿飞李彦鹏
关键词:文本挖掘条件随机域
生物医学文献蛋白质关系抽取——从实体识别到网络构建
本文介绍了一个从实体识别到PPI网络构建的生物医学文献蛋白质关系抽取系统。该系统采用特征耦合泛化策略进行蛋白质实体识别;采用基于扩展语义相似度的方法进行蛋白质名均一化;融合了基于特征的核、树核以及图核进行蛋白质关系抽取;...
杨志豪赵哲焕李彦鹏胡运翠谢冬林鸿飞
关键词:文本挖掘信息抽取蛋白质关系抽取支撑向量机多核学习
文献传递
基于多核学习的医学文献蛋白质关系抽取被引量:13
2011年
从生物医学文献中抽取蛋白质交互作用关系对蛋白质知识网络的建立、新药的研制等均具有重要的意义。为此,提出一种基于多核学习的方法,用于从文献中自动抽取蛋白质关系信息。该方法融合基于特征的核、树核以及图核,并扩展最短路径依存树以及依存路径以利用更多的上下文关系信息。在AImed语料上的实验得到63.9%的F值和87.83%的AUC值,表明该方法具有较好的性能。
唐楠杨志豪林鸿飞李彦鹏
关键词:文本挖掘信息抽取蛋白质关系抽取核方法多核学习
基于支持向量机的生物医学文献蛋白质关系抽取被引量:20
2008年
从生物医学文献中抽取蛋白质(基因)交互作用关系对蛋白质知识网络的建立、蛋白质关系的预测以及新药的研制等均具有重要的意义.提出了一种基于支持向量机(SVM)的蛋白质(基因)交互作用关系抽取方法.该方法除了选取词项特征、关键词特征、实体距离特征、链接特征外,还利用链接语法分析方法可以获得较高准确率的特性,引入链接语法分析方法抽取结果特征.实验结果表明,该方法的召回率性能与使用同一测试语料的其他系统相比具有明显的优势,综合分类率F指标也高于其他系统.
杨志豪洪莉林鸿飞李彦鹏
关键词:关系抽取支持向量机
基于特征耦合泛化的药名实体识别被引量:10
2014年
药名识别的直接目的是从生物医学文本中寻找药名。目前,药物相关研究不断出现,远远超出了维护人员更新药物信息数据库的速度,这就迫切需要一种自动提取药物信息的技术。该文采用了一种基于特征耦合泛化(FCG)的半监督学习方法生成药名词典,然后将药名词典和条件随机场结合进行药名实体识别。首先我们用模板的方法构造了一个药名词典,然后用FCG方法对词典去噪,最后将去噪后的词典用在测试集上进行药名实体识别,得到了76.73%的F值。
何林娜杨志豪林鸿飞李彦鹏唐利娟
关键词:CRF
特征耦合泛化及其在文体挖掘中的应用
文本挖掘(Text Mining)技术是利用计算机程序自动读取和理解自然语言文本,并从中发现有价值的信息,从而提高人们的工作效率。随着信息技术的飞速发展和互联网时代的来临,该技术拥有了很大的实际应用价值和广阔的应用前景。...
李彦鹏
关键词:文本挖掘命名实体识别关系抽取文本分类
文献传递
基于监督学习和半监督学习的蛋白质关系抽取被引量:1
2013年
提出了一种将监督学习和半监督学习融合的方法,并用于从文献中自动抽取蛋白质关系.在AImed语料上的实验得到63.2%的F值,这表明该方法达到目前较好的性能.
王艳华杨志豪李彦鹏唐利娟林鸿飞
关键词:文本挖掘信息抽取蛋白质关系抽取半监督学习
条件随机域与上下文线索结合的生物实体识别被引量:4
2008年
介绍一个用于在生物医学文献中识别基因、蛋白质等生物实体的识别方法。该方法基于条件随机域方法,选取适当特征进行实体识别,利用上下文线索进一步提高识别性能。实验结果表明上下文线索的引入使识别性能在条件随机域方法基础上提高了近3%,从而获得了较好的最终识别效果。
杨志豪林鸿飞李彦鹏
关键词:文本挖掘条件随机域
基于特征贡献度的特征选择方法在文本分类中应用被引量:10
2011年
在目前的文本分类问题中,特征选择方法被认为是提高分类精度和效率的一种有效方法.提出了一种基于特征贡献度FCD(feature contribution degree)的特征选择方法,本方法将某个特征对于类别之间区分能力的贡献度大小作为该特征被选取的条件,特征对于某一类别的FCD值为特征在该类中出现的文档数与在所有类别中出现的文档数的比值.对该方法进行了实验,并与一些常用的特征选择方法进行了比较,实验结果表明该方法具有更好的分类效果.
孟佳娜林鸿飞李彦鹏
关键词:文本分类向量空间模型
共2页<12>
聚类工具0