维尼拉·木沙江
- 作品数:20 被引量:8H指数:2
- 供职机构:新疆大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金新疆维吾尔自治区高技术研究发展计划项目新疆维吾尔自治区高校科研计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 维、哈、柯文搜索引擎中网页爬行器的设计与实现
- 搜索引擎网页爬行器的任务是收集网页,而收集能力的好坏直接影响搜索结果。本文提出了维、哈、柯多文种搜索引擎中网页爬行器的结构及其设计方案。
- 维尼拉·木沙江吐尔洪·吾司曼
- 关键词:搜索引擎
- 文献传递
- 基于文本的图片检索中图片相关文本提取技术的研究
- 基于文本的图片检索是图片检索技术中最常用的方法,其中,图片相关文本的提取是基于文本的图片检索技术的关键。图片相关文本提取技术的好坏直接影响查全率和查准率。本文以维吾尔文网页为例,首先分析基于文本的图片检索技术相关知识和图...
- 热依玛依·买买提维尼拉·木沙江
- 关键词:图片检索
- 文献传递
- 基于频繁模式挖掘的维吾尔文智能组词方法被引量:6
- 2012年
- 以词间空格作为自然分隔符,非常容易获取维吾尔文中的词,但又很难获取结构完整的语义词,因此多种文本处理效果总是很不理想。提出维吾尔文组词的新概念,将数据挖掘中的频繁模式挖掘方法引入到维吾尔文组词中,再结合维吾尔文的语言文字特点,将无先验知识的模式挖掘问题转化为特定模式的匹配问题,提出了一种快速高效的频繁模式挖掘算法,来获取语义完整的维吾尔文词。实验结果表明,通过该算法获取的维吾尔文词,在结构上是稳定的,语义上是完整而独立的。
- 吐尔地·托合提维尼拉·木沙江艾斯卡尔·艾木都拉
- 关键词:分词组词
- 维吾尔文搜索引擎的倒排索引设计与实现
- 索引结构的设计是搜索引擎的核心,直接关系到搜索引擎的检索速度,在搜索引擎中运用最多的索引结构为倒排索引结构。本文针对维吾尔文网页的特点,维吾尔文单词提取其词干方法进行了初步探讨,设计了维吾尔文搜索引擎的一种倒排索引结构。
- 维尼拉·木沙江吴俊森吐尔根·依布拉音
- 关键词:倒排索引搜索引擎维吾尔语
- 文献传递
- 研究维吾尔文Web文档聚类算法设计与实现
- 随着网络信息量的迅速增长,传统的搜索引擎技术也只能为用户提越来越长的检索结果列表。用户不得不从中进行按照自己标准的二次检索.浪费了时间和效率.针对这问题,据挖掘领域中的聚类技术引入网络信息搜索中(Web聚类技术),以解决...
- 买买提依明·哈斯木维尼拉·木沙江
- 关键词:聚类后缀树STC
- 文献传递
- 维吾尔文Web信息检索中基于改进VSM的文档表示及相似度研究
- 基于向量空间模型的信息检索技术中,用向量空间模型来表示Web文档,以索引词权重作为主要依据进行用户查询与Web文档之间的相似度计算,并根据相似度大小进行查询结果的排序。本文在传统TFIDF的基础上,用索引词的位置加权系数...
- 吐尔地·托合提维尼拉·木沙江艾斯卡尔·艾木都拉
- 关键词:信息检索向量空间模型相似度
- 文献传递
- 维、哈、柯全文搜索引擎中查询处理研究与实现
- 本文研究了基于web的维、哈、柯多文种全文搜索引擎中一系列查询处理难题:用户查询请求的快速响应、对查询短语必要的预处理、基于词根的索引及查询、查询结果的有效组织、网页摘要的动态生成,以及以本民族风格显示搜索结果等。在设计...
- 吐尔地·托合提维尼拉·木沙江艾斯卡尔·艾木都拉
- 关键词:倒排索引
- 文献传递
- 维、哈、柯多语种搜索引擎中改进索引创建的新方法的构思
- 2011年
- 通过对目前处于研究发展阶段的后缀数组技术与倒排索引技术的简单介绍,并对两者的优缺点进行了对比,对维、哈、柯文搜索引擎的索引创建进行改进的新方法提出了构思,以实现查询效率和查准率的提高。
- 赵丽红维尼拉·木沙江
- 关键词:索引技术倒排索引后缀数组
- 基于语义串抽取及主题相似度度量的维吾尔文文本分类
- 本文研究一种改进的n元递增算法来抽取维吾尔文本中表达关键信息的语义串,并用带权语义串集来刻画文本主题,提出了一种类似于Jaccard相似度的文本和类主题相似度度量方法,并实现了相应的维吾尔文分类算法。实验结果表明,本文提...
- 吐尔地·托合提维尼拉·木沙江艾斯卡尔·艾木都拉
- 基于统计的维吾尔文网页自动摘要提取研究
- 2011年
- 为让用户快速、有效的得到真正符合自己需求的信息该文首次从维吾尔文的特征出发对基于统计的自动摘要提取技术进行研究,并找到适合维吾尔文的基于统计的自动摘要提取方法。此方法用在维哈柯搜索引擎,大大提高了搜索引擎的性能。
- 阿热帕提·尕依提维尼拉·木沙江
- 关键词:维吾尔文特征提取