国家自然科学基金(61163043)
- 作品数:22 被引量:60H指数:4
- 相关作者:扎西加多拉赵栋材高定国春燕更多>>
- 相关机构:西藏大学西北民族大学青海师范大学更多>>
- 发文基金:国家自然科学基金教育部人文社会科学研究重大课题攻关项目国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字航空宇航科学技术更多>>
- 史诗《霍岭》语料库句子及诗行计量解析
- 2015年
- 通过建立格萨尔史诗经典版本《霍岭》语料库,对其史诗的句子与诗行进行了计量分析,发现在《霍岭》语料库中,有30555个诗行,共有标点句42725个,其中散文标点句有12170个;完全重复的句子共有1321种,总重复数为5599次。
- 多拉扎西加
- 关键词:格萨尔句法研究
- 藏文文本分词赋码一体化研究被引量:4
- 2012年
- 在藏文文本理解中虚词发挥着重要的句法、语义桥接作用,其规则的有效性在藏文分词处理中扮演着特殊的角色。由于虚词本身及其角色的丰富性,在一定意义上可以说藏文分词处理是虚词识别的过程。因此,虚词识别的正确与否直接影响着藏文文本分词处理的效果。文章依据藏语自身的语法规律和虚词功能的特殊性,首先构建了虚词知识库、虚词兼类库,以及其作为藏文连续文本中识别虚词的依据;其次,研制了标有词汇属性的分词词表和一定规模的训练语料库资源,以基于条件随机域(CRF)的方法进行词性标注,并结合虚词和词性赋码的资源制作了藏文自动分词赋码一体化处理的模型。
- 扎西加高定国
- 关键词:藏文分词
- 藏语语音合成中语料数据标注规则的设计被引量:5
- 2012年
- 基于隐马尔可夫模型(HMM)的藏语语音合成系统中,语料数据的标注是训练声学模型的基础和关键。文章结合藏语独有的语音特点对语料数据设计套标注规则,并以Praat为标注环境实现语料的标注。
- 曲珍春燕
- 交互式藏文初学软件的设计被引量:3
- 2015年
- 藏语是中华民族语言文字的重要组成部分,了解博大的藏文化正在逐渐成为一种时尚。伴随着社会经济的快速发展,越来越多的人开始学习藏语,本文就是从这样的需求出发,以软件设计为平台,针对零基础的初学者,从藏语言文字基础的读音、书写、例词、例句考虑,以模块为单位进行设计,学习内容涵盖了元音、辅音、上加字、下加字、前加字、后加字和再后加字以及用于测试的快乐学习模块。同时介绍了对读音、书写、初识方面进行系统学习的模块设计步骤,为同类软件设计者提供了一定的借鉴和参考。
- 裴春宝赵朋朋许宁
- 关键词:藏文软件设计
- 藏语依存树库构建的理论与方法探析被引量:11
- 2015年
- 依存语法又称"从属关系语法",研究句子各构成成分之间的支配和从属关系。依存结构是指句子中词与词之间的句法结构关系,该结构以树状结构进行描述,被称之为依存结构树库。文章以依存语法的理论框架作为藏语树库构建的理论指导,充分借鉴依存语法的思想精髓,结合藏语语法体系,设立出符合藏语语法体系的句法和语义标注关系体系,设计了判别式的句法分析算法,从而构建了多维视窗的藏语依存树库。具体分析时,首先,对依存语法的由来、定义、依存关系的适用性等背景知识做了简要的阐释;其次,在藏语句子的筛选、藏语依存结构的形式化模型、藏语依存的骨架结构以及藏语依存树的多维关系等方面进行了研究和分析。
- 扎西加多拉
- 关键词:依存语法
- 基于BP网络的木刻藏文经书文字识别研究被引量:5
- 2012年
- 木刻藏文经书文中出现字符间粘连、断裂、遮挡现象严重,为识别带来极大的困难。在字符切分、特征提取等文字识别方法基础上,增加了基于BP网络的训练方法,通过对大量的木刻藏文经书字符的训练,修正了数据,收敛了识别结果。实验结果显示,此方法有助于提高木刻藏文经书的文字识别正确率。
- 赵栋材
- 关键词:文字识别BP网络
- 基于藏文音节特征的模式匹配算法的研究被引量:3
- 2014年
- 近年来针对网络中藏文舆情等的研究已在相关研究机构进行。模式匹配问题是计算机科学中的一个基本问题在藏文舆情、网络入侵检测等应用中起着重要的作用。其研究内容在上述众多领域均有重要价值。针对藏文字本身特性的字符匹配算法在相关文献并没有给出相应的解决办法,而是直接采用了中文或英文的模式匹配算法作为研究的基础。在此认为给出一个合理有效的藏文字符串的模式匹配算法,能非常有效的提高藏文字符的匹配效率。
- 春燕
- 关键词:藏文音节BM算法
- 词汇计量与史诗诸要素的解析——以语料库方法解构格萨尔史诗之《霍岭》被引量:3
- 2014年
- 文章利用语料库对格萨尔史诗中的人物、地点、宫殿城堡、武器铠甲、生活用具、氏族部落、诸神祇以及各种动物进行了统计分析。通过统计,一一剥离了史诗的构成要素,勾勒出一个较为清晰的格萨尔史诗的故事结构和生活场景。分析发现,《霍岭》分部的史诗人物超过了1000人,场景或故事地点达800多个,生活用具1000多种,武器铠甲等400多种,甚至战马名称也多达140多个,战神等神祇更是多达400多个,这样庞杂的故事却在史诗里显得那么自然流畅,也从侧面体现了史诗的非同凡响之处。
- 多拉扎西加
- 关键词:格萨尔史诗语料库
- 面向信息处理的藏文字词统计分析设计被引量:1
- 2015年
- 本文按照软件工程的基本思路,宏观上设计出藏文字词统计软件的基本架构,从微观上设计出藏文字词量化的功能模块,实现了藏文字词统计分析的算法,并通过语料库语言学的理论和研究方法对规模为36万词种的词典语料库中统计出总数为9111个藏文音节数,60万次词构成的藏语教材语料库中统计出藏文音节总词量、文本数、词种数、词频、词性、频次、词长、累加频率、分布率、使用度等大量珍贵的数据,这对于促进藏语语言学研究和语言教学领域字词量化研究及教材编写等提供较为科学的数据。
- 扎西加多拉
- 关键词:藏文音节
- 小型四旋翼飞行器的研究与制作被引量:3
- 2016年
- 小型四旋翼无人机广泛应用在教育、现场巡视、救灾、物流、航拍和军队等领域,其应用前景十分广阔。为了实现小型四旋翼无人机的制作,首先根据四旋翼控制系统的基本原理及理论框架,利用开源硬件构建小型四旋翼无人机,最终实现了通过遥控进行航拍和测绘等任务。
- 杨建扎西加周欢欢杨倩
- 关键词:四旋翼飞行器自动控制无人机