安见才让
- 作品数:125 被引量:116H指数:5
- 供职机构:青海民族大学计算机学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金青海省科技厅基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学电子电信更多>>
- 一种汉藏双语句子对齐算法
- 2011年
- 双语语料库建设及其自动对齐研究对计算语言学的发展具有重要意义。双语对齐技术是加工双语文本的核心,对齐效果的好坏直接影响了以后工作的进行。基于汉藏双语的实际情况,提出了一种利用句子长度、相似度和锚点信息的汉藏双语句子对齐方法,该方法用相似度找到句子的锚点,用锚点将双语文本分割成几个分块,在对应双语分块中用基于长度的对齐实现句子的对齐。通过测试数据进行的实验结果显示,这种方法有着良好的准确率,有效地解决了汉藏双语真实文本的句子对齐问题。
- 安见才让王玲玲
- 关键词:句子对齐锚点相似度
- 藏文应用文文本自动分类研究被引量:1
- 2019年
- 随着藏文应用文的数量与类型与日俱增,人们对藏文应用文信息准确性的要求也越来越高,图书资料的现代化管理迫在眉睫。为了适应应用文管理的新趋势,更好地使用户查阅应用文资料,研究藏文应用文检索系统有很大的必要性。KNN分类方法是一种用实例解决问题的分类方法,KNN分类方法在向量空间模型下是一种性能较好的分类算法。需要通过对文本的预处理、特征选择、模型建立、训练分类器和分类五个步骤来实现对文本的分类处理。
- 多杰措安见才让
- 藏文信息处理中自动分词方法的研究
- 2011年
- 藏文分词是藏文信息处理领域的一项不可缺少的基础性工作,也是智能化藏文信息处理的关键所在。在藏文分词的研究过程中藏文分词的准确性,直接制约着藏文输入法研究、藏文电子词典建设、藏文词频统计、搜索引擎的设计和实现、机器翻译系统的开发、藏文语料库建设以及藏语语义分析研究等高层藏文信息处理技术的进一步发展。本文借鉴汉语的分词理论和方法,提出符合藏文特性的分词方法,以及歧义字段切分和未登录词识别等相关问题,并举例说明。
- 叶西切忠安见才让
- 关键词:藏文分词未登录词识别
- “鱼儿”藏棋的设计与实现
- 2016年
- 藏族棋艺是藏族人民集体创造的智慧结晶,是藏族民间文化宝库中不可多得的一颗璀璨的明珠。"棋"在藏语中有两种叫法,一种是"久",而另一种则是"哲","鱼儿"藏棋就是其中之一,而该文就是完成对"鱼儿"藏棋的设计和实现。
- 才让拉毛安见才让
- 藏文问答系统中答案抽取算法的研究被引量:1
- 2016年
- 该文提出了藏文问答系统中答案抽取的算法,即采用了基于相同词汇的句子相似度算法和基于关键词的相似度算法相结合的算法来抽取最佳的答案。
- 群毛措安见才让
- 关键词:相似度答案抽取关键词
- 藏文搜索引擎系统中网页自动摘要的研究被引量:3
- 2010年
- 给出了藏文搜索引擎中网页自动摘要的基本思路、基本步骤和Web文摘的定义,讨论了分词算法,提出了基于句子抽取的Web文摘生成算法。算法中将每个Web句子的权重分解为Web特征词权重和Web句子结构权重,Web句子结构权重充分考虑排版格式和超连接属性。根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要。最后实验分析表明效果较好。
- 安见才让
- 关键词:自然语言处理分词
- 基于特征识别的藏语语音识别研究被引量:2
- 2014年
- 研究藏语音识别对信息技术的发展,对藏民族在文化、经济、教育、服务业等领域内具有举措发展的作用,为藏民族、社会和国家的发展更好的服务。
- 德吉安见才让
- 关键词:藏民族发音方式语音特征声学特征语音输入端点检测
- 面向汉语教学的汉藏语料库系统设计和实现
- 2012年
- 主要介绍了开发制作的汉藏平行语料库系统的特点、功能,以及系统的设计思想和总体框架。系统以藏区使用的小学和初中汉语教材的内容为生语料,实现了改进的B+树索引、词表生成、词语搭配分析、汉藏双语检索、朗读和对齐等功能,为少数民族地区的汉语教学、信息挖掘和自然语言处理等方面的研究提供了丰富而真实的语言环境。
- 安见才让
- 关键词:汉语教学
- 藏文虚词添置校对算法研究与实现被引量:1
- 2013年
- 该文通过藏文语法中对虚词的定义为线索;分析藏文真实文本,识别出藏文各种虚词。按照藏文虚词的添置规则进行校对。提出了一种基于规则和藏文语法相结合的校对算法。实验表明,系统对藏文虚词的查错率达100%。
- 公保才让安见才让
- 关键词:真实文本查错时态助词离合词指人名词疑问语气
- 印刷体藏文识别中字符切分方法的研究被引量:3
- 2019年
- 印刷体藏文字符的准确切分是识别的关键,由于藏文字符结构的特殊性导致字符之间会出现重叠粘连的现象,使得切分很困难。文章提出多策略细化切分方法,首先用积分投影法实现行和单字的粗切分,再对重叠粘连的字符,根据连通域、藏文字符基线位置像素的统计、字符宽度等信息进行细切分。实验表明,该切分方法提高了印刷体藏文字符切分的准确率,为提高印刷体藏文的识别效率提供基础。
- 公保杰安见才让
- 关键词:积分投影切分