陈鑫
- 作品数:20 被引量:37H指数:4
- 供职机构:山西大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划山西省回国留学人员科研经费资助项目更多>>
- 相关领域:自动化与计算机技术语言文字经济管理更多>>
- 基于词语关联的散文阅读理解问题答案获取方法被引量:4
- 2018年
- 高考语文阅读理解问答题中的提问方式复杂多样,使用的词语语义抽象,而相关阅读材料的内容表达丰富和含蓄,造成问题中的词语与阅读材料中词语存在一定的语义鸿沟。为了解决这一问题,该文对词语关联进行相关研究。首先利用LDA主题聚类方法,将同一主题类的词语进行聚类,根据各类词语的词性、词频特征,筛选与主题相关联的词语,再利用Word2Vec的语义相似度计算,将每一个主题关联的词语扩展,获得与主题词语义关联的词语。最后,将所提出的方法应用于近12年北京高考题和模拟题的散文抽取类问答题解答中,实验结果表明该方法优于传统的词语扩展方法。
- 乔霈王素格陈鑫谭红叶陈千王元龙
- 关键词:问答题
- 基于词性特征的明喻识别及要素抽取方法被引量:1
- 2021年
- 比喻是一种利用事物之间的相似点建立关系的修辞方式。明喻是比喻中最常见的形式,具有明显的喻词,例如"像",用于关联本体和喻体。近年来高考语文散文类鉴赏题中多有考查明喻句的试题,为了解答此类鉴赏题,需要识别比喻句中的本体和喻体要素。该文提出了基于词性特征的明喻识别及要素抽取方法。首先将句子中词向量化表示与词性特征向量化表示进行融合,将融合后的向量输入到BiLSTM中进行训练,然后利用CRF解码出全局最优标注序列;最后得到明喻识别和要素抽取的结果。公开数据集上的实验结果表明,该方法优于已有的单任务方法;同时也将该文方法应用于北京高考语文鉴赏题中比喻句的识别与要素抽取,验证了方法的可行性。
- 赵琳玲王素格陈鑫王典张兆滨
- 关键词:比喻本体喻体CRF
- 基于FAHP的第三方物流企业诚信评价研究
- 物流作为当今快速发展的产业,是经济领域的黑大陆,在国民与国家经济发展中的作用越来越大。但是在物流产业当今高速繁荣发展的同时,也暴露出了许多非常糟糕的问题,在这些问题当中第三方物流企业的诚信缺失最为严重,这对物流产业的健康...
- 陈鑫
- 关键词:模糊层次分析法
- 文献传递
- 高考语文阅读理解自动答题系统
- 2022年
- 机器阅读理解任务需要机器理解篇章并回答相关问题,是许多应用系统中的一项核心任务。该文面向高考语文中的现代文阅读理解文本语义表示、候选句抽取、鉴赏分析等关键技术展开研究,针对选择题、问答题等构建了相应的答题引擎,并在高考真题及测试题上,对系统进行了实验验证与错误分析,实验结果表明,该文所构建的系统能够在一定程度上解答问题。未来将围绕语义表示、知识的统一表征与知识聚合、迁移学习等前沿技术,提升阅读理解系统的复杂综合推理能力、概括分析能力、语言鉴赏能力。
- 谭红叶郭少茹陈鑫王素格李茹张虎杨陟卓陈千钱揖丽王元龙关勇吕国英
- 关键词:高考语文
- 基于语言粒度的语言技巧及隐式情绪识别
- 语言技巧作为自然语言处理技术中的语用学概念,是一种帮助人类理解世界及增强文本表达的手段,常应用于文学作品中。从语用学的角度,对于不包含情绪词的语言技巧隐式情绪文本,以含蓄晦涩的表达方式传递情绪,因而对机器理解文本的情感提...
- 陈鑫
- 关键词:语言技巧知识库
- 文献传递
- 阅读理解中观点类问题的扩展研究被引量:2
- 2020年
- 在高考语文阅读理解中,观点类问题中的观点表达较为抽象,为了从阅读材料中获取与问题相关的答案信息,需要对问题中的抽象词语进行扩展,达到扩展观点类问题的目的。该文提出了基于多任务层级长短时记忆网络(Multi-HLSTM)的问题扩展建模方法。首先将阅读材料与问题进行交互注意,同时建模问题预测和答案预测两个任务,使模型对问题进一步扩展。最后将扩展后的问题与原问题同时应用于问题的答案候选句抽取中。通过在高考语文观点类的真题、模拟题以及DuReader的描述观点类数据集上进行实验,验证了本文的问题扩展模型对答案候选句的抽取性能具有一定的提升作用。
- 张兆滨王素格陈鑫赵琳玲王典
- 关键词:高考语文
- 面向高考阅读理解鉴赏题语言风格判别方法
- 语言风格是高考阅读理解中的重要考察内容,然而,不同考察方式所需的分类层次不尽相同,本文将语言风格鉴赏转化为层次分类问题.在类别标签指导下,利用图分割算法,获取与特定类别相对应的原始簇.基于原始簇,利用层次聚类获取语言风格...
- 陈鑫王素格李德玉谭红叶陈千王元龙
- 关键词:鉴赏题语言风格自然语言处理
- 一种基于多任务学习的修辞格及隐式情绪识别方法
- 本发明涉及计算机文本情感分析领域,具体涉及一种基于多任务学习的修辞格及隐式情绪识别方法。本方法为了识别修辞格与情绪而提出,首先利用BERT与Tree‑LSTMs捕获句子的语义及句法表示。基于此,设计门控机制的修辞格分类器...
- 陈鑫王素格李德玉
- 文献传递
- 基于词语相关度的微博新情感词自动识别被引量:4
- 2016年
- 针对微博中新情感词的识别问题,提出了一种基于词语相关度的微博新情感词自动识别方法。首先,对于分词软件把一个新词错分成几个词的问题,利用组合思想将相邻词进行合并作为新词的候选词;其次,为了充分利用词语上下文的语义信息,采用神经网络训练语料获得候选新词的空间表示向量;最后,利用已有的情感词典作为指导,融合基于词表集合的关联度排序和最大关联度排序算法,在候选词上筛选,获得最终的情感新词。在COAE2014(第六届中文倾向性分析评测)任务3语料上,提出的融合算法与点互信息(PMI)、增强互信息(EMI)、多词表达距离(MED)、新词语概率(NWP)以及基于词向量的新词识别方法相比,准确率至少提高了22%,说明该方法自动识别微博新情感词效果优于其他五种方法。
- 陈鑫王素格廖健
- 面向高考阅读理解观点类问题的答案抽取方法被引量:1
- 2018年
- 为了克服高考阅读理解观点类问题中仅仅利用关键词进行答案句抽取的不足,通过对单篇文章建立LDA(latent dirichlet allocation)模型,计算阅读材料中每一句话与问题的主题分布相似度.利用SVM(support vector machine)分类器,对主题分布相似度高的句子进行分类,用于获取具有观点特征的候选观点句,最后将其与问题观点进行相似度计算并排序,选取排名前α个句子作为题目的答案句.该方法在标注好的高考观点类问题的答案句识别中,总体正确率达到了47.8%,并能将答案句的排序提前.实验结果表明,散文阅读理解题中采用多主题方法比单主题时具有更好的效果.
- 王素格李书鸣陈鑫穆婉青乔霈
- 关键词:问答系统语义相似主题