顾彦慧 作品数:34 被引量:89 H指数:5 供职机构: 南京师范大学 更多>> 发文基金: 国家自然科学基金 江苏省高校自然科学研究项目 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 理学 文化科学 更多>>
一种高并发实时多属性聚合地图集群服务系统 本发明公开了一种高并发实时多属性聚合地图集群服务系统,包括用户前端服务模块、基于Hadoop的聚合地图集群服务模块、地理元数据服务模块、系统开发运维模块和代码版本库模块,所述用户前端服务模块由第一方客户端、直接服务接入模... 顾彦慧 龙毅 顾敏 卢新宇 曲维光 周俊生 陈燚 陈伍香基于神经网络的片段级中文命名实体识别 被引量:20 2018年 命名实体识别是自然语言处理的一个重要基础任务。传统基于统计学习模型的命名实体识别方法严重依赖特征工程,特征设计需要大量人工参与和专家知识,而且已有的方法通常大多将中文命名实体识别任务看作一个字符序列标注问题,需要依赖局部字符标记区分实体边界。为了减弱系统对人工特征设计的依赖,避免字符序列化标注方法的不足,该文对基于神经网络的片段级中文命名实体识别方法进行探索研究。通过采用深度学习片段神经网络结构,实现特征的自动学习,并通过获取片段信息对片段整体分配标记,同时完成实体边界识别和分类。基于神经网络的片段级中文命名实体识别方法在MSRA数据集上对人名、地名和机构名识别的总体F1值达到了90.44%。 王蕾 谢云 周俊生 顾彦慧 曲维光关键词:神经网络 面向中文AMR标注体系的兼语语料库构建及兼语结构识别 被引量:1 2021年 兼语结构是汉语中常见的一种动词结构,由述宾短语与主谓短语共享兼语,结构复杂,给句法分析造成困难,因此兼语识别工作对于语义解析及下游任务都具有重要意义。但现存兼语语料库较少,面向中文抽象语义表示(AMR)标注体系的兼语语料库构建仍处于空白阶段。针对这一现状,该文总结出一套兼语语料库标注规范,构建了包含4760个兼语句的面向中文AMR标注体系的兼语语料库。基于构建的语料库,采用LA-BiLSTM-CRF模型识别兼语结构,达到了86.06%的F1,并分析了识别结果,提出了改进方向。 侯文惠 曲维光 魏庭新 魏庭新 李斌 顾彦慧关键词:兼语结构 基于转发图的微博事件主题摘要方法 被引量:2 2014年 自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化. 赵斌 吉根林 曲维光 顾彦慧关键词:可视化 基于神经网络的复句判定及其关系识别研究 被引量:1 2021年 复句是自然语言的基本单位之一,复句的判定及其语义关系的识别,对于句法解析、篇章理解等都有着非常重要的作用。基于神经网络模型识别自然语料中的复句,判断其复句关系,构造复句判定和复句关系识别联合模型,以最大程度地减少误差传递。在复句判定任务中通过Bi-LSTM获得上下文语义信息,采用注意力机制捕获句内跨距离搭配信息,利用CNN捕获句子局部信息。在复句关系识别任务中,使用Bert增强句子的语义表示,运用Tree-LSTM对句法结构和成分标记进行建模。在CAMR中文语料上的实验结果表明,基于注意力机制的复句判定模型F1值达到91.7%,基于Tree-LSTM的复句关系识别模型F1值达到69.15%。在联合模型中,2项任务的F1值分别达到92.15%和66.25%,说明联合学习能够使不同任务获得更多特征,从而提高模型性能。 贾旭楠 魏庭新 曲维光 曲维光 顾彦慧关键词:神经网络 语义建模 基于神经网络的连动句识别 2022年 连动句是具备连动结构的句子,是汉语中一种特殊的句法结构,在现代汉语中十分常见且使用频繁。连动句语法结构和语义关系都很复杂,在识别中存在许多问题,对此该文针对连动句的识别问题进行了研究,提出了一种基于神经网络的连动句识别方法。该方法分两步:第一步,运用简单的规则对语料进行预处理;第二步,利用文本分类的思想,使用BERT编码,利用多层CNN与BiLSTM模型联合提取特征进行分类,进而完成连动句识别任务。在人工标注的语料上进行实验,实验结果达到92.71%的准确率,F_(1)值为87.41%。 孙超 曲维光 曲维光 顾彦慧 魏庭新 顾彦慧关键词:连动句 文本分类 神经网络 一种基于神经网络的三维催化材料催化特性筛选系统 本发明公开了一种基于神经网络的三维催化材料催化特性筛选系统,包括催化剂材料浅层特性采样模块、催化剂材料结构信息嵌入模块、催化材料性质学习模块、催化材料隐层信息表示模块和催化材料多任务筛选模块,所述催化剂材料浅层特性采样模... 顾彦慧 李亚飞 顾敏 卢新宇 曲维光 王金兰 周俊生 张先锋文献传递 基于信息素划分生态位的浮游藻类互动快速智能分析办法 本发明公开了一种基于信息素划分生态位的浮游藻类互动快速智能分析办法,具体包括如下组成部分:(1)基于卷积神经网络(CNN)和SIFT SURF HOG,对不同藻类样本的特征进行提取,包括数量和形状特征;(2)通过学习已知... 彭宁康 顾彦慧一种融合了浮游藻类色素蛋白光谱与图像的水质分析方法 本发明公开了一种融合了浮游藻类色素蛋白光谱与图像的水质分析方法,包括如下组成部分:(1)光谱分析仪器模块:包括光谱仪、分光计,用于测量浮游藻类色素蛋白的光谱特征;(2)数据处理单元模块;(3)色素蛋白数据库模块:色素蛋白... 彭宁康 姚佳怡 时子延 顾彦慧基于转移神经网络的中文AMR解析 被引量:2 2019年 抽象语义表示(abstract meaning representation,AMR)是一种领域无关的句子语义表示方法,它将一个句子的语义抽象为一个单根有向无环图,AMR解析旨在将句子解析为对应的AMR图。目前,中文AMR研究仍然处于起步阶段。该文结合中文AMR特性,采用基于转移神经网络的方法对中文AMR解析问题展开了试验性研究。首先,实现了一个基于转移解码方法的增量式中文AMR解析神经网络基线系统;然后,通过引入依存路径语义关系表示学习和上下文相关词语语义表示学习,丰富了特征的表示;最后,模型中应用序列化标注的模型实现AMR概念识别,优化了AMR概念识别效果。实验结果表明,该模型在中文AMR解析任务中达到了0.61的Smatch F1值,明显优于基线系统。 吴泰中 顾敏 周俊生 曲维光 李斌 顾彦慧