扎西加
- 作品数:35 被引量:96H指数:6
- 供职机构:青海师范大学更多>>
- 发文基金:国家自然科学基金教育部人文社会科学研究基金教育部人文社会科学研究重大课题攻关项目更多>>
- 相关领域:自动化与计算机技术语言文字历史地理经济管理更多>>
- 拉萨话文读辅音韵尾的声学分析
- 本文立足于传统语言学的基础之上,结合现代语音学研究的方法,分析拉萨话文读辅音韵尾的声学特征,对文读语音单位做出理论上的定性描述和声学的定量分析。
- 央金卓嘎扎西加
- 关键词:辅音韵尾声学分析语音软件
- 自然语言处理用藏语格助词的语法信息研究被引量:6
- 2010年
- 该文主要探讨了藏语格助词的语法信息、语义信息、功能结构等内容,从而为建立藏语格助词的语法属性库提供详实的参数。这对句子进行分析与描述,观察句子歧义都有着重要的意义。
- 扎西加顿珠次仁
- 关键词:语法信息
- 藏语依存树库构建的理论与方法探析被引量:11
- 2015年
- 依存语法又称"从属关系语法",研究句子各构成成分之间的支配和从属关系。依存结构是指句子中词与词之间的句法结构关系,该结构以树状结构进行描述,被称之为依存结构树库。文章以依存语法的理论框架作为藏语树库构建的理论指导,充分借鉴依存语法的思想精髓,结合藏语语法体系,设立出符合藏语语法体系的句法和语义标注关系体系,设计了判别式的句法分析算法,从而构建了多维视窗的藏语依存树库。具体分析时,首先,对依存语法的由来、定义、依存关系的适用性等背景知识做了简要的阐释;其次,在藏语句子的筛选、藏语依存结构的形式化模型、藏语依存的骨架结构以及藏语依存树的多维关系等方面进行了研究和分析。
- 扎西加多拉
- 关键词:依存语法
- 基于藏语信息处理的词类体系研究被引量:8
- 2008年
- 在自然语言处理中,词类划分属于基础研究,其重要性不可忽视。文章以明确藏语词类划分的标准入手,根据藏语自身的特点和规律性、系统性,从藏文信息处理的角度出发,提出了自己的见解和分类方法,致力于探索藏语词类的划分标准,为藏文信息处理各个层次的发展进行最基础的研究。
- 扎西加索南尖措
- 关键词:词类体系
- 基于FUG的藏语句法形式化描述被引量:2
- 2014年
- 针对藏语自然语言形式化的实际需求,分析了用复杂特征描述藏语句子的必要性,引入了复杂特征集和合一运算的概念。以形式化为出发点,以现代语言学理论为后盾,以实例举证的方式对藏语词汇、句法、语义的规则及句子合一运算提出了探索性的研究思路,并且采用框式表示的方法,力求从形式化的角度为藏语自然语言处理提供便利。
- 扎西加多拉
- 关键词:句子结构语义信息
- 信息处理用藏语词类划分研究
- 自然语言理解是语言信息处理的最高目标。计算机对自然语言的处理,首要确定语言系统的基本单位。如果最小的基本单位不确定。计算机将无法运算,既不能从小到大理解句子意思,也无法展开文本分类、自动分词、自动文摘、机器翻译、词类标注...
- 扎西加
- 关键词:词类体系
- 文献传递网络资源链接
- 藏语语料库TEI标记规范探讨被引量:4
- 2011年
- 在语言信息处理过程中,大规模真实文本处理已成为一个研究热点。藏语语料库的标记在汉藏英机器翻译、信息检索、文本数据挖掘、词典编纂的研究工作中占很重要的地位。为了便于数据交换和共享,该文基于TEI编码的藏语语料,对藏语语料库中文本的属性信息和结构信息标记做了系统而全面的探讨。
- 扎西加高定国
- 关键词:藏语语料库
- 词汇计量与史诗诸要素的解析——以语料库方法解构格萨尔史诗之《霍岭》被引量:3
- 2014年
- 文章利用语料库对格萨尔史诗中的人物、地点、宫殿城堡、武器铠甲、生活用具、氏族部落、诸神祇以及各种动物进行了统计分析。通过统计,一一剥离了史诗的构成要素,勾勒出一个较为清晰的格萨尔史诗的故事结构和生活场景。分析发现,《霍岭》分部的史诗人物超过了1000人,场景或故事地点达800多个,生活用具1000多种,武器铠甲等400多种,甚至战马名称也多达140多个,战神等神祇更是多达400多个,这样庞杂的故事却在史诗里显得那么自然流畅,也从侧面体现了史诗的非同凡响之处。
- 多拉扎西加
- 关键词:格萨尔史诗语料库
- 史诗《霍岭》语料库句子及诗行计量解析
- 2015年
- 通过建立格萨尔史诗经典版本《霍岭》语料库,对其史诗的句子与诗行进行了计量分析,发现在《霍岭》语料库中,有30555个诗行,共有标点句42725个,其中散文标点句有12170个;完全重复的句子共有1321种,总重复数为5599次。
- 多拉扎西加
- 关键词:格萨尔句法研究
- 最大熵软决策树HMM最大似然藏语音合成
- 2017年
- 针对传统的硬决策树藏语音合成系统存在泛化性能不强的问题,设计改进一种二进制软决策树算法,实现基于语境因子的藏语音合成模型参数估计。内部节点根据子代节点隶属度进行选取,每个节点可视为基于语境依赖隶属度的模糊集合,将每个语境分配给几个重叠的叶节点,提高模型概括和函数逼近性能;采用最大熵平滑分布进行局部一阶矩和全局二阶矩特征捕捉,实现隐式马尔可夫(HMM)输出概率分布的软决策参数最大似然估计。仿真验证结果表明,所提算法在满足应用实时性要求的前提下,可有效提高藏语音合成效果。
- 曲珍扎西加春燕
- 关键词:最大熵