刘挺
- 作品数:364 被引量:3,655H指数:32
- 供职机构:哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学语言文字经济管理更多>>
- 基于词汇支配度的汉语依存分析模型被引量:29
- 2006年
- 如何应用句法结构和词汇化是句法分析建模所面临的两个主要问题,汉语依存分析对这两方面做了初步的探索.首先通过对大规模依存树库的统计学习,获取其中的词汇依存信息,建立了一个词汇化的概率分析模型.然后引入词汇支配度的概念,以充分利用了句子中的结构信息.词汇化方法有效地弥补了以前工作中词性信息的粒度过粗问题.同时,词汇支配度增强了对句法结构的识别,有效地避免了非法结构的生成.在4000句的测试集上,依存分析获得了约74%的正确率.
- 刘挺马金山李生
- 关键词:依存语法句法分析动态规划
- 高考语文议论文自动生成技术概述
- 2022年
- 议论文自动生成是自然语言生成中一项极具挑战性的任务,与诗歌、故事等生成任务不同,议论文文章长度更长,且要求具有明确的核心论点和清晰的论证结构。上述特点使得现有的生成模型难以直接迁移。本文基于已有自然语言生成相关技术从抽取和生成两个维度分别论述了面向高考议论文的自动生成模型。与已有方法不同的是,两个系统都充分结合议论文自身结构特点设计了不同的优化方案,抽取式模型采用词到句、句到段的多步生成方式,可解释性和可控性更强;生成式方法在学习篇章结构的基础上端到端地逐段生成作文样例,行文更加流畅。最终本文还展示了相关方案的生成样例,并针对当前不足对议论文自动生成任务的未来发展方向进行展望。
- 冯骁骋秦兵刘挺
- 基于句法结构分析的中文问题分类被引量:109
- 2006年
- 问题分类是问答系统中重要的组成部分,问题分类结果的好坏直接影响问答系统的质量。本文提出了一种用于问题分类的特征提取的新方法,该方法主要使用句法分析的结果,提取问题的主干和疑问词及其附属成分作为分类的特征,此方法大幅度地减少了噪音,突出了问题分类的主要特征,利用贝叶斯分类器分类,有效地提高了问题分类的精度。实验结果证明了该方法的有效性,大类和小类的分类精度分别达到了86.62%和71.92%,取得了较好的效果。
- 文勖张宇刘挺马金山
- 关键词:计算机应用中文信息处理问答系统特征提取句法分析
- 面向句法分析的句子片段识别
- 句子长度对句法分析的性能有着很大的影响,无论是搜索算法的复杂度还是歧义结构的数量都会随着句子长度的增加而急剧增长。本文针对汉语句子的长度问题,使用了一种片段识别的方法:先将句子划分为多个片段, 根据语法结构,识别出每个片...
- 马金山刘挺李生
- 关键词:依存句法分析标点
- 文献传递
- 双语语料库段落重组对齐方法研究
- 网络上存在的大量双语资源,给构建大规模双语语料库提供了可能。双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视。针对目前可收集到的双语资源大都没有做到段落对齐,本文结合基于句子长度和基于词典的两种经典对齐算...
- 李维刚刘挺王震李生
- 关键词:双语语料库锚点
- 文献传递
- 基于XML的开放式语言技术平台:LTP
- 本文描述了一套面向Web基于XML的开放式中文语言处理平台,命名为“语言技术平台 LTP”。LTP包含5项主要内容:语言技术置标语言LTML、基于DOM Tree的一套DLL模块、一套可视化工具、基于LTML的语料库资源...
- 郎君刘挺李生张会鹏
- 关键词:自然语言处理信息检索XML
- 文献传递
- 基于表示学习的开放域中文知识推理被引量:7
- 2018年
- 知识库通常以网络的形式被组织起来,网络中每个节点代表实体,而每条连边则代表实体间的关系。为了利用这种网状知识库中的知识,往往需要设计专门的、复杂度较高的图算法。然而这些算法并不能很好适用于知识推理,尤其是随着知识库的知识规模不断扩大,基于网状结构知识库的推理很难较好地满足实时计算的需求。该文使用基于TransE模型的知识表示学习进行知识推理,包括对实体关系三元组中关系指示词以及尾实体的推理,其中关系指示词推理的实验取得了较好的结果,且推理过程无需设计复杂的算法,仅涉及向量的简单运算。另外,该文对原始TransE模型的代价函数进行改进,以更好地适用于开放域中文知识库表示学习。
- 姜天文秦兵刘挺
- 关键词:知识推理
- 利用DialoGPT作为特征标注器的对话摘要生成系统
- 利用DialoGPT作为特征标注器的对话摘要生成系统,本发明涉及对话摘要生成系统。本发明是为了解决现有对话摘要生成方法对话摘要获取耗时耗力,效率差,准确率低的问题。系统包括:所述数据采集模块用于获取数据集;所述对话预训练...
- 冯骁骋冯夏冲秦兵刘挺朱坤
- 基于人工标注的个性化检索系统评测的研究被引量:8
- 2009年
- 个性化信息检索可以根据用户的检索兴趣返回个性化的检索结果。该文构建了个性化检索标注系统和个性化检索评测系统,生成个性化检索系统所需的语料集;并提出了以用户为中心的基于人工标注的个性化检索评价方法。个性化检索评测系统采用了NIST所建立的评价体系,根据用户的标注结果对个性化检索系统的性能进行自动评价,并给出量化、直观的性能指标。
- 张宇范基礼郑伟邹博伟刘挺
- 关键词:计算机应用中文信息处理个性化信息检索
- 一种基于局部信息表示的细粒度情感元素抽取方法
- 本发明为了解决现有的细粒度情感元素抽取方法当抽取评价对象时,不能很好地利用紧随其后的单词,导致短语词性判断错误、抽取结果缺漏较多,并且难以判断当前词是否是评价对象一部分的缺点,而提出一种基于局部信息表示的细粒度情感元素抽...
- 秦兵赵妍妍刘挺袁建华
- 文献传递