赵怿怡
- 作品数:14 被引量:34H指数:4
- 供职机构:厦门大学人文学院中国语言文学系更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字艺术文化科学更多>>
- 基于树库的汉语依存句法分析被引量:4
- 2009年
- 旨在探索利用语言学手段来提高句法分析精度的可能性.采用MaltParser和自建的汉语依存树库进行相关汉语依存句法分析实验.通过对句法分析结果的分析,找出影响句法分析精度的主要因素,并据此对树库中处理某些语言结构的方式进行修改.然后再对得到的句法分析数据进行进一步分析,以确定所用方法的有效性.结果表明,无标记依存句法分析精度提高了5.5%,有标记依存句法分析精度提高了7.5%.
- 刘海涛赵怿怡
- 关键词:依存句法分析树库中文信息处理语料库语言学
- 基于网络观的语言研究被引量:3
- 2014年
- 语言是一种复杂动态系统。语言系统的复杂性体现在各类语言符号相互联系和演变的过程中。支持这一论断的可靠证据是语言以复杂的神经网络为生理基础,这一基础也为从网络结构角度认知语言复杂系统提供了现实依据。语言网络观具备从语言学内部到语言学外部多学科理论的支撑:语言学内部有较完整的以语言网络为基础的语言学理论——神经认知语言学与词语法;语言学外部有以认知科学为主导的神经、生理、心理学实验证据;复杂网络技术的发展革新了语料库语言学的分析方法,为建立语言的统计模型提供了新思路。现有语言网络研究成果证明了基于网络观的语言研究具备充分的有效性与可行性。
- 赵怿怡刘海涛
- 关键词:语言网络语料库语言学
- 语言网络研究的数学模型——从复杂网络、社会网络到语言网络被引量:5
- 2015年
- 复杂网络技术的发展为大数据时代的语言研究提供了新的视角。网络方法应用到语言研究的重要目的是探索语言网络的结构特征规律和功能演化规律。该文综述了以图论为基础的复杂网络发展及社会网络、语言网络的主要数学模型,试图从复杂网络共性特征——小世界、无标度特征中进一步剥离出语言网络的个性特征,为语言符号多层级网络结构、功能研究提供参考。
- 赵怿怡刘海涛
- 关键词:语言网络网络演化图论
- 歧义结构理解中的依存距离最小化倾向被引量:5
- 2014年
- 用依存句法分析汉语歧义结构发现人脑在句法加工时倾向选择最小化依存距离的句法结构。该发现从依存理论角度解释了以往依照短语结构句法分析潜在歧义结构"VP+N1+的+N2"无法说明心理学实验结果的原因,找到了歧义结构实时阅读过程中倾向选择特定句法结构的语言学依据。最小化依存距离的认知机制是降低言语工作记忆成本的有效方法,是言语理解过程中的重要机制之一。
- 赵怿怡刘海涛
- 关键词:言语工作记忆歧义结构句法分析
- 汉语依存树库的构建
- 语料库是计算语言学进入新时代的基础。构建依存树库是目前国际计算语言学研究的流行趋势。本文总结国内外树库建设经验,通过建设汉语依存树库的实践,对树库建设中的基本问题进行阐述,并尝试运用统计的方法来分析一些语言现象。
- 赵怿怡关润池
- 关键词:树库
- 文献传递
- 语言同现网、句法网、语义网的构建与比较被引量:10
- 2014年
- 网络方法应用于语言研究是语言研究大数据时代的新趋势。语言是一个多层级的符号系统,选择哪种语言单位作为网络节点,选择哪种语言单位间的关系作为网络联结,影响到语言网络的结构和功能。该文梳理了以汉语词为单位,以同现、句法、语义关系为联结依据的几类网络构造方法,并针对同一文本构造三类网络发现:句法网络的网络直径、平均路径长度远小于同现网络,实词在语义网络中占据中心节点位置。这提示我们网络分析方法的应用仍要以可靠的语言学理论为指导,从语言学内部出发才能更好解释各类语言网络的差异。
- 赵怿怡刘海涛
- 关键词:语义网
- 句法网与语义网的对比研究被引量:1
- 2018年
- 基于网络观的语言研究已经成为语言分析的趋势之一。但不同语言单位层级、不同语言单位关系的选取导致了语言网络的差异。从词的同现网到句法网再到语义网所需要的语言学知识也逐步深化,该文旨在构建语义学理论支撑的语义网络,并把虚词纳入语义分析过程,分别以句法关系和语义关系作为联结,用Cytoscape构建了句法网和语义网。结果发现:语义网的直径、平均最短距离比句法网大,层级性比句法网差,聚集系数比句法网小,虚词节点"的""和""个"等有可能是局部的中心节点。
- 马丹赵怿怡
- 关键词:语义网虚词
- 汉语特殊结构的句法标注策略
- 句法树库建设是当今国内外计算语言学研究的热点之一。本文探讨了在依存树库中,分析和处理汉语特殊结构的一些问题,如:"X是"和"X说"结构、离合词+趋向补语结构、特殊的重叠结构。通过对比短语结构树库和依存树库对这些结构的处理...
- 高松赵怿怡刘海涛
- 关键词:离合词
- 文献传递
- 新中国首套中小学语文教材的时间空间人物研究被引量:3
- 2020年
- 新中国首套中小学语文教材的课文内容,在时间上,以现当代为主。空间上,国外题材有关苏联的占了3/4,显示出中苏正处于亲密期。国内题材主要发生在华北解放区、晋察冀边区及京津地区,其次是东三省、江苏、山东、陕西、贵州等省区。人物上,突显了“儿童”“劳动者”“军人”“领袖”四类人物形象的特点。新中国首套中小学语文教材重视青少年的政治思想、健康情感的培养,紧贴社会现实、充分反映当下社会变革和实践,以北方农村革命根据地为基本活动空间,注重现当代革命文化熏陶和传播,对传统文化则表示出了相当的淡化和忽略等特点。
- 苏新春赵怿怡
- 汉语口语依存树库中特殊结构处理
- 口语依存树库的建设不但可以满足统计自然语言处理的需要,也有助于基于语料库的句法研究。口语具有无意识地反复、成分残缺等特点,对其各成分之间依存关系的研究有助于我们更好地发现言语交际过程中的特点与规律,有助于把握口语和书面语...
- 关润池赵怿怡
- 关键词:口语
- 文献传递