您的位置: 专家智库 > >

国家社会科学基金(10BTQ045)

作品数:6 被引量:18H指数:3
相关作者:田生伟禹龙冯冠军王宇光梁建飞更多>>
相关机构:新疆大学更多>>
发文基金:国家自然科学基金国家社会科学基金博士科研启动基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 6篇自动化与计算...

主题

  • 3篇维吾尔
  • 3篇维吾尔语
  • 2篇语料
  • 2篇语料库
  • 1篇对齐
  • 1篇语料库构建
  • 1篇语言模型
  • 1篇正文提取
  • 1篇双语
  • 1篇双语平行语料...
  • 1篇双语语料
  • 1篇随机场
  • 1篇条件随机场
  • 1篇平行语料
  • 1篇平行语料库
  • 1篇情感
  • 1篇情感分类
  • 1篇主题信息
  • 1篇自动获取技术
  • 1篇自动识别

机构

  • 6篇新疆大学

作者

  • 6篇田生伟
  • 4篇禹龙
  • 2篇冯冠军
  • 1篇梁建飞
  • 1篇姜子进
  • 1篇杨飞宇
  • 1篇王宇光

传媒

  • 3篇计算机应用与...
  • 1篇计算机工程
  • 1篇现代图书情报...
  • 1篇计算机工程与...

年份

  • 1篇2012
  • 5篇2011
6 条 记 录,以下是 1-6
排序方式:
维吾尔语情感分类算法被引量:5
2011年
情感分类是一项具有实用价值的分类技术。目前英语和汉语的情感分类的研究比较多,而针对维吾尔语的研究较少。以n-gram模型作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,选择不同的特征数量,以NaǐveBayes、ME(最大熵)和SVM(支持向量机)作为不同的文本分类方法,分别进行了维吾尔语情感分类实验,并对实验结果进行了比较,结果表明:采用UniGrams特征表示方法、在5000个特征数量和合适的特征选择函数,ME和SVM对维吾尔语情感分类能取得较好的效果。
田生伟禹龙王宇光
关键词:维吾尔语情感分类语言模型
基于CRFs自动构建维吾尔语情感词语料库被引量:6
2011年
提出维吾尔语情感语料库的构建规范,设计和实现维吾尔语情感语料库辅助整理系统。该系统结合维吾尔语情感语料的具体特点,多方面分析维吾尔语情感词汇的特征,利用条件随机场(CRFs)模型进行维吾尔语情感词汇的自动识别。测试结果验证该系统能够大幅度降低人工劳动,高效快速地标注维吾尔语情感词语料。
冯冠军禹龙田生伟
关键词:维吾尔语语料库构建
Web环境下自动获取汉、维语料库被引量:1
2011年
句子级的语料库是机器翻译的重要资源,但由于获取途径的限制,句子级的语料库不仅数量有限而且经常集中在特定领域,很难适应真实应用的需求。根据锚文本信息通过搜索引擎在网络上找到汉维双语平行网站,并下载网站中所有的双语平行网页。提取出有正文的网页,根据html特征,建立html树,提出一种将html树结构作为识别网页正文内容重要特征的网页分析方法,并根据正文内容信息相似性提取网页正文。对提取出的正文进行句子切分,分别创建句子级的汉、维语料库,为以后创建句子级的汉维双语平行语料库服务。
姜子进吐尔根.依布拉音赛依旦.阿不力米提田生伟
关键词:双语平行语料库正文提取
汉维语短语搭配的识别和对齐
2011年
提出一种简单实用的汉维语短语搭配的抽取方法。该方法不需要汉语分词、词性标注等预处理工作,根据语料中汉语字和维语单词的共现信息,避免语料中个别词汇数目极少而共现信息值较大出现噪音,采用t检验消除,相对于利用分词和词性标注等技术的抽取方法,该算法简单且时间效率较高。实验结果表明,该方法利用较小规模的语料库也能达到较好的短语搭配抽取效果。
禹龙田生伟杨飞宇
关键词:双语语料对齐
汉维主题网页自动获取技术的研究被引量:2
2012年
为了获得大量用于机器翻译研究的汉维(维吾尔)文语料,提出一种从网页中自动获取主题信息的方法。考虑到有主题网页中主题信息分布相对集中、文本密度较高,并且这类网页中大量的噪音信息是由链接引入的,提出的算法首先将链接分为噪音链接和非噪音链接,并在源码中删除噪音链接的锚文本和非噪音链接的HTML标签,然后利用容器标签将源码划分为若干部分并删除文本长度和文本密度均小于各自阈值的源码块。针对汉维网页做了实验,实验结果表明,算法在设置合适的阈值的情况下良好率达到90%以上。
梁建飞吐尔根.依布拉音田生伟赛依旦.阿不力米提
关键词:主题信息
维吾尔语情感词汇自动识别被引量:8
2011年
针对维吾尔语情感词汇获取难度大、人工扩充情感词汇工作量大且效率低的缺陷,结合维吾尔语主观文本语料的具体特点,分析维吾尔语情感词汇在情感语料中表现的特征,建立维吾尔语情感词汇的特征模板,利用条件随机场模型实现维吾尔语情感词汇的自动识别方法。实验结果验证该方法能有效自动识别情感词汇,降低人工识别情感词汇的工作量。
禹龙田生伟冯冠军
关键词:维吾尔语条件随机场
共1页<1>
聚类工具0