您的位置: 专家智库 > >

李光泉

作品数:3 被引量:4H指数:1
供职机构:江西财经大学信息管理学院更多>>
发文基金:国家自然科学基金江西省卫生厅中医药科研基金江西省科技支撑计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇主题
  • 1篇主题抽取
  • 1篇谓词
  • 1篇文本
  • 1篇文本主题
  • 1篇连通度
  • 1篇关联规则
  • 1篇本主
  • 1篇PCM
  • 1篇WEB文本
  • 1篇抽取

机构

  • 3篇江西财经大学
  • 2篇江西中医药大...
  • 1篇江西师范大学

作者

  • 3篇夏家莉
  • 3篇李光泉
  • 2篇曹重华
  • 2篇曹中华
  • 2篇程春雷
  • 1篇曹中华
  • 1篇陈辉

传媒

  • 2篇小型微型计算...
  • 1篇计算机科学与...

年份

  • 1篇2019
  • 1篇2016
  • 1篇2014
3 条 记 录,以下是 1-3
排序方式:
词关联规则层状稀疏主题编码模型被引量:3
2019年
模型规则化可以通过给模型加入先验知识,而避免模型过拟合,并且能够使模型参数稀疏,选择出最有代表性的模型参数.具有稀疏性的主题特征能够更有效的表示文本语义信息,通过WordNet和Word2Vec可以得到相似词集,将相似词集的编码向量归属为相同组,构造相似词组语义约束,并将其表示为层状结构化先验信息,论文因此而实现了两种层状稀疏规则化方法,应用于主题编码模型.实验表明采用层状规则化的稀疏编码模型可以提高主题模型编码效果,学习到主题一致性、分类结果更好的文本主题信息.
曹中华曹中华夏家莉李光泉
谓词概念连通度的中文实体关系抽取策略被引量:1
2014年
中文实体关系抽取是开放域文本检索与知识发现的研究热点,传统的抽取策略普遍存在人工标注量大,模式通用性受限,关系抽取粒度相对固定等问题,限制了其在开放领域的关系抽取效果。基于概念的结构分层和关系连通,面向中文实体关系构建了谓词概念模型(predicate concept model,PCM),在此基础上,提出了增量学习的谓词概念获取策略PCIA和基于谓词概念连通的关系抽取策略PCCS,由此进行了开放域非紧密的、远距离实体关系的抽取。各谓词概念的构建相对独立,概念组合更为灵活,对关系的描述具有更好的通用性和可解释性,为开放域未知关系的识别与抽取提供了有效手段。实验结果表明,PCCS有效提升了中文实体识别及实体连通路径选择的质量,获得了良好的关系抽取性能。
夏家莉程春雷陈辉曹重华李光泉
关系概念的Web文本主题抽取模型研究被引量:1
2016年
Web文本主题抽取是文本分类与知识发现的研究热点,既有的抽取方法一般存在主题粒度确定、主题语义解释、新网络词汇识别等难题,限制了其在开放应用领域的使用效果.论文借助百度百科词条背景,基于关系概念的概念分层以及主题连通的思想,面向中文文本构建了关系概念主题抽取模型(relational concept topic model,RCTM),RCTM模拟人的概念局部识别,上下文语境理解的并行阅读方式,由此实现中文文本的主题抽取.RCTM中主题的表达相对独立、语义连通灵活,主题的描述具有更好的通用性与可解释性,为Web文本主题抽取提供了新的研究思路.实验表明,RCTM具有良好的主题抽取准确率,文本抽取出的主题词,简洁直观、可解释性好.针对开放的WEB文本,具有更好的通用性、稳定性.
程春雷夏家莉曹重华李光泉曹中华
关键词:文本主题抽取
共1页<1>
聚类工具0