博士科研启动基金(BS100120)
- 作品数:4 被引量:16H指数:3
- 相关作者:冯冠军禹龙田生伟黄俊翟献民更多>>
- 相关机构:新疆大学更多>>
- 发文基金:博士科研启动基金国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向维吾尔语文本的改进后缀树聚类被引量:2
- 2012年
- 针对后缀树聚类选取基类时,基类短语出现信息不规范、重复和冗余的问题,提出了一种改进后缀树聚类算法。该算法首先以短语互信息算法改进基类的选取,选出遵守维吾尔语语法规则的基类短语;然后,利用短语归并算法对选取的重复基类短语进行归并;最后,在前两步的工作基础上,利用短语去冗余算法处理冗余的基类短语。实验证明,与传统后缀树聚类(STC)相比,改进后缀树聚算法的全面率、准确率都得到了提高。这表明,改进算法有效地改善了聚类效果。
- 翟献民田生伟禹龙冯冠军
- 关键词:维吾尔语后缀树互信息冗余
- 基于CRFs自动构建维吾尔语情感词语料库被引量:6
- 2011年
- 提出维吾尔语情感语料库的构建规范,设计和实现维吾尔语情感语料库辅助整理系统。该系统结合维吾尔语情感语料的具体特点,多方面分析维吾尔语情感词汇的特征,利用条件随机场(CRFs)模型进行维吾尔语情感词汇的自动识别。测试结果验证该系统能够大幅度降低人工劳动,高效快速地标注维吾尔语情感词语料。
- 冯冠军禹龙田生伟
- 关键词:维吾尔语语料库构建
- 维吾尔语情感词汇自动识别被引量:8
- 2011年
- 针对维吾尔语情感词汇获取难度大、人工扩充情感词汇工作量大且效率低的缺陷,结合维吾尔语主观文本语料的具体特点,分析维吾尔语情感词汇在情感语料中表现的特征,建立维吾尔语情感词汇的特征模板,利用条件随机场模型实现维吾尔语情感词汇的自动识别方法。实验结果验证该方法能有效自动识别情感词汇,降低人工识别情感词汇的工作量。
- 禹龙田生伟冯冠军
- 关键词:维吾尔语条件随机场
- 基于维吾尔语情感词的句子情感分析被引量:5
- 2012年
- 提出基于自动标注的维吾尔语情感词分析句子情感的方法。将8种情感类别作为情感类别集合。判断句子中是否含有转折性连词,若有则屏蔽含有转折性连词句子的前半部分,通过条件随机场模型自动标注句子中的情感词,依据标注的情感词,为句子的每种情感类别打分,得分最高的情感类型作为句子的候选情感。识别句中维语的否定成分,根据否定成分出现的奇偶次数对句子的候选情感修正,得到句子的最终情感类型。实验结果表明,在句子情感分析上该方法可取得较好的效果。
- 黄俊田生伟禹龙冯冠军
- 关键词:维吾尔语条件随机场模型