您的位置: 专家智库 > >

黄瑞章

作品数:117 被引量:122H指数:6
供职机构:贵州大学更多>>
发文基金:国家自然科学基金贵州省科学技术基金贵州省科技厅重大专项更多>>
相关领域:自动化与计算机技术文化科学政治法律经济管理更多>>

文献类型

  • 73篇期刊文章
  • 42篇专利

领域

  • 76篇自动化与计算...
  • 7篇文化科学
  • 3篇政治法律
  • 1篇经济管理
  • 1篇天文地球
  • 1篇电子电信
  • 1篇交通运输工程
  • 1篇语言文字

主题

  • 27篇聚类
  • 23篇神经网
  • 23篇神经网络
  • 22篇抽取
  • 21篇文本
  • 20篇文本聚类
  • 13篇网络
  • 11篇矩阵
  • 11篇关系抽取
  • 10篇向量
  • 9篇中文
  • 9篇卷积
  • 9篇标签
  • 7篇狄利克雷
  • 7篇多维度
  • 7篇新闻
  • 7篇司法
  • 7篇维度
  • 7篇文本表示
  • 7篇命名实体识别

机构

  • 115篇贵州大学
  • 8篇贵州耕云科技...
  • 7篇贵州轻工职业...
  • 4篇西安交通大学
  • 4篇贵州师范学院
  • 2篇贵州财经大学
  • 2篇南京大学
  • 1篇贵州民族大学

作者

  • 115篇黄瑞章
  • 77篇秦永彬
  • 6篇林川
  • 6篇王凯
  • 3篇郑庆华
  • 3篇唐向红
  • 3篇刘丽娟
  • 2篇刘莎
  • 2篇杨健
  • 2篇程欣宇
  • 2篇李婷
  • 2篇唐瑞雪
  • 2篇魏琴
  • 2篇刘博伟
  • 1篇刘青
  • 1篇田有亮
  • 1篇黄蓉
  • 1篇张超
  • 1篇董博
  • 1篇冯丽

传媒

  • 9篇计算机应用
  • 8篇计算机工程与...
  • 6篇计算机工程与...
  • 5篇计算机与数字...
  • 4篇计算机工程
  • 4篇计算机应用研...
  • 4篇山东大学学报...
  • 4篇大数据
  • 3篇计算机科学
  • 2篇通信学报
  • 2篇数据采集与处...
  • 2篇计算机工程与...
  • 2篇西安交通大学...
  • 2篇电子科技大学...
  • 2篇应用科学学报
  • 2篇中文信息学报
  • 1篇燕山大学学报
  • 1篇模式识别与人...
  • 1篇南京大学学报...
  • 1篇计算机系统应...

年份

  • 10篇2024
  • 30篇2023
  • 17篇2022
  • 11篇2021
  • 14篇2020
  • 14篇2019
  • 6篇2018
  • 7篇2017
  • 4篇2016
  • 1篇2015
  • 1篇2014
117 条 记 录,以下是 1-10
排序方式:
一种基于层次狄利克雷多项分配模型的多源文本聚类方法
本发明公开了一种基于层次狄利克雷多项分配模型的多源文本聚类方法,所述方法包含有如下步骤:一、从多个来源收集文本集;二、将来自多个数据源的文本信息进行文本预处理;三、基于层次狄利克雷多项分配模型构建主题模型;四、进行Blo...
黄瑞章许伟佳秦永彬陈艳平
一种自适应结构学习的深度文本聚类方法及装置
本发明公开了一种基于自适应结构学习的深度文本聚类方法,所述方法包括如下步骤:步骤一:构造K‑近邻图;步骤二:通过自适应阈值策略生成自适应结构的图;步骤三:使用阈值衰减策略让图卷积核动态调整拓扑范围,从而学习到文本的自适应...
任丽娜黄瑞章潘伟
DCsR:一种面向中文文本的集成式纠错框架
2023年
中文文本纠错技术在自然语言处理中有着非常重要的应用。针对书写灵活多变的中文文本,现有的纠错模型无法覆盖多种错误类型且存在从候选集合TOPK中挑选TOP1时出错概率极大的问题。提出了一种面向中文文本的集成式纠错框架——DCsR,摒弃以往建立在已知错误类型的假设上利用单一模型进行纠错的解决方案,根据不同场景选择添加多种表现优异的纠错模型分别进行纠错再集成召回更全面的候选集,同时根据自定义特征的重要程度建立了一个多策略、可拓展的候选排序算法,以挑选更具有公信力的修正结果。DCsR框架有效地解决了模型的偏向性问题,进一步全面提升了对中文文本拼写纠错的能力。实验结果表明,在公开数据集SIGHAN15上,对比现在的主流纠错模型,使用DCsR框架进行纠错的F1值比表现最优的单模型纠错高出了3.93%,进一步提升了对中文文本的纠错能力。针对CGED2020进行的消融实验也表明了DCsR框架的有效性。
曹军航黄瑞章黄瑞章赵建辉
一种基于神经网络的谓语中心词识别方法
本发明公开了一种基于神经网络的谓语中心词识别方法,所述方法包括如下步骤:步骤一:基于预训练词向量和随机词向量对文本进行向量映射;步骤二:通过神经网络模型获取句子的特征及长期依赖关系;步骤三:使用Highway网络缓解深度...
黄瑞章靳文繁秦永彬陈艳平钟新洋
文献传递
面向中文关系抽取的句子结构获取方法
2021年
在关系抽取中,神经网络模型是目前最常用的技术之一,然而现有神经网络模型很少考虑句子中两个实体之间的结构特征。该文针对关系抽取任务的特点,提出了基于神经网络模型的句子结构获取方法。该方法通过对关系实例中两个实体的位置进行特殊标记,使神经网络模型能够有效捕获句子中关于实体的结构信息。为了验证方法的有效性,分别采用两种主流的神经网络模型进行对比实验,实验结果表明,该方法在ACE 2005中文关系抽取数据集上的抽取性能得到显著提升,超出对比工作约11个百分点,表明该方法能有效提升关系抽取任务的性能。
杨卫哲秦永彬黄瑞章王凯程华龄唐瑞雪程欣宇陈艳平
关键词:关系抽取结构特征自然语言处理
一种基于卷积神经网络的分段池化关系抽取方法
本发明公开了一种基于卷积神经网络的分段池化关系抽取方法,所述方法包括如下步骤:步骤一:基于预训练词向量和随机词向量以及零向量对文本进行向量映射;步骤二:通过神经网络对向量矩阵进行卷积操作提取特征;步骤3:对卷积后的结果分...
黄瑞章杨卫哲王凯秦永彬陈艳平
基于狄利克雷多项混合模型的长文本辅助短文本的文本聚类方法
本发明公开了一种基于狄利克雷多项混合模型的长文本辅助短文本的文本聚类方法。针对短文本的特征稀疏问题,本发明提出了主题相关长文本辅助短文本的思想,辅助的基础是长文本与短文本共享相同的主题‑词语分配。为了更好地提升聚类效果,...
黄瑞章闫盈盈马灿徐立洋丁志远王瑞黄庭刘博伟
文献传递
基于Highway-BiLSTM网络的汉语谓语中心词识别研究被引量:3
2021年
针对汉语谓语中心词识别困难及唯一性的问题,提出了一种基于Highway-BiLSTM网络的深度学习模型。首先,通过多层BiLSTM网络叠加获取句子内部不同粒度抽象语义信息的直接依赖关系;然后,利用Highway网络缓解深层模型出现的梯度消失问题;最后,通过约束层对输出路径进行规划,解决谓语中心词的唯一性问题。实验结果表明,该方法有效提升了谓语中心词识别的性能。
黄瑞章靳文繁陈艳平秦永彬秦永彬
关键词:唯一性
基于实体边界组合的关系抽取方法被引量:1
2022年
关系抽取旨在从文本中抽取实体与实体之间的语义关系。作为关系抽取的上层任务,实体识别所产生的错误将扩散至关系抽取,从而导致级联错误。与实体相比,实体边界粒度小且具有二义性,更易识别。因此,提出一种基于实体边界组合的关系抽取方法,通过跳过实体,对实体边界两两组合来进行关系抽取。由于边界性能高于实体性能,所以错误扩散的问题得到了缓解;并且通过特征组合的方法将实体类型特征和位置特征加入模型中,性能得到了进一步提高,再次减轻了错误扩散带来的影响。实验结果表明,所提方法在ACE 2005英文数据集的宏平均F1值优于表格-序列编码器方法8.61个百分点。
李昊李昊唐瑞雪黄瑞章黄瑞章秦永彬谭曦
关键词:关系抽取
基于反绎学习的裁判文书量刑情节识别
2022年
针对司法领域标记数据匮乏、标注质量不高、存在强逻辑性导致裁判文书量刑情节识别效果不佳的问题,提出一种基于反绎学习的量刑情节识别模型ABL-CON。首先结合神经网络与领域逻辑推理,通过半监督学习方法,使用置信学习方法表征情节识别置信度;然后修正无标签数据经过神经网络产生的不合逻辑的错误情节,重新训练识别模型,以提高识别精度。在自构建的司法数据集上的实验结果表明,使用50%标注数据与50%无标注数据的ABL-CON模型在Macro_F1值和Micro_F1值上分别达到了90.35%和90.58%,优于同样条件下的BERT和SS-ABL,也超越了使用100%标注数据的BERT模型。ABL-CON模型通过逻辑反绎修正不符合逻辑的标签能够有效提高标签的逻辑合理性以及标签的识别能力。
李锦烨黄瑞章秦永彬陈艳平田小瑜
关键词:半监督学习
共12页<12345678910>
聚类工具0