王素格
- 作品数:167 被引量:538H指数:12
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金山西省科技攻关计划项目更多>>
- 相关领域:自动化与计算机技术文化科学社会学理学更多>>
- 文本褒贬倾向判别研究
- 2011年
- 在文本的向量空间表示模型下,针对文本褒贬倾向判别问题,提出了一种基于潜在语义分析的特征权重计算方法。除词频信息外,该方法考虑了潜在语义分析所提供的同义词、近义词信息对特征权重的影响。采用基于Fisher判别准则的特征选择方法,以支持向量机作为分类器,在2739篇语料(2008年中文倾向性分析评测)上进行了实验。实验结果表明,提出的特征权重计算方法对文本褒贬倾向判别是有效的。
- 李银花王素格
- 关键词:概率潜在语义分析FISHER判别准则支持向量机
- 汉语词性自动标注系统的设计与实现被引量:7
- 2001年
- 介绍了汉语词性自动标注系统的设计与实现.该系统实现了统计与规则相结合的方法进行汉语词性自动标注.描述了该系统的总体结构,以及所使用的非兼类词表、兼类词表、标记集和词性标注规则的组织,特别对稀疏矩阵及其存储方法进行了详细的介绍。
- 王素格张永奎
- 关键词:自然语言理解语料库神经网络
- 一种SNESIM多点模拟结果不确定性评估方法
- 一种SNESIM多点模拟结果不确定性评估方法:(1)在进行多点模拟之前,根据训练图像和模板对模拟结果事前进行图像级不确定性评价;(2)在得到多点模拟结果之后,对模拟结果进行像元级不确定性评价。本发明能够有效的评价多点模拟...
- 白鹤翔王素格李艳红李德玉翟岩慧
- 文献传递
- 一种文本对话的情绪识别与预测方法
- 本发明涉及文本交互应用开发技术领域,公开了一种文本对话的情绪识别与预测方法,包括用于文本对话情绪识别任务的交互式双状态情绪细胞模型和用于文本对话情绪预测任务的交互式双状态情绪细胞模型,用于文本对话情绪识别任务的交互式双状...
- 李大宇李旸王素格
- 文献传递
- 基于最大熵模型与投票法的汉语动词与动词搭配识别被引量:5
- 2007年
- 提出一种基于最大熵模型和投票法的汉语动词与动词搭配识别方法.该方法通过组合目标动词与候选搭配词的上下文词性信息以及关联程度的统计信息构成5种复合特征模板,然后利用最大熵方法获得它们对应搭配识别器,最后采用最好搭配识别器占优的投票法构造组合识别器.实验结果表明,同时包含上下文词性信息和统计信息的识别器优于单纯包含上下文词性信息或统计信息的识别器,但最好搭配识别器占优的组合识别器效果更佳.
- 王素格杨军玲张武
- 关键词:搭配最大熵模型特征函数投票法
- 文本流多粒度主题结构建模研究被引量:2
- 2015年
- 主题检测近年来在文本挖掘和自然语言处理领域得到了广泛的应用,对主题进行结构建模是主题检测的基础。为了对文本流中的多粒度主题进行建模,提出一种基于语义层次树的主题结构模型。该模型利用领域本体的特点,将主题同本体作一一映射,结合概率理论,将概念集里的概念用主题树的叶子节点表示,每一层中的节点均是下一层节点的多项分布,使之更适合描述文本流中多粒度的主题结构。为了便于构建主题的空间结构,提出主题的相似度和事件相关度计算方法。该文结尾设计了实验构造真实新闻文本流数据上的主题树。实验结果表明,该结构模型能够体现主题丰富的多粒度空间语义特征。
- 陈千郭鑫王素格张虎
- 关键词:主题检测
- 基于模糊不一致对的多标记属性约简被引量:1
- 2020年
- 在实际生活当中,存在着大量的高维多标记数据,为解决维度灾难问题,通常需要约简属性集。针对目前的多标记属性约简算法未考虑标记关系问题,本文提出了一种融合标记关系的模糊不一致对多标记属性约简算法。利用相对熵(KL散度)度量标记之间的关系,定义标记权重,结合标记权重,定义模糊不一致对,考虑到属性对于模糊不一致对的区分性,定义属性重要性并进行属性约简。在8个数据集上的对比实验表明,所提基于模糊不一致对的多标记属性约简算法优于当前的多标记属性约简算法。
- 高琪李德玉王素格
- 关键词:属性约简KL散度模糊粗糙集区分矩阵
- 汉语动词-动词搭配规则与分布特征被引量:8
- 2005年
- 搭配是汉语自动句法分析的重要知识源,而动词是句法分析的核心和前提。论文面向中文信息处理,通过对真实文本的统计分析归纳了用于自动获取搭配的规则,研究了动词-动词搭配中各关系类型的分布特征以及搭配词语的位置分布特征,在此基础上提出了抽取动宾、动补、连谓和并列四种关系的动词-动词搭配的适宜观察窗口。
- 由丽萍王素格
- 关键词:词语搭配语料库中文信息处理
- 基于概率图模型的文本对象情感分析
- 2014年
- 情感分析旨在从文本数据中自动识别主观情感,即文本中表达的观点、态度、感受等,在线评论通常都涉及特定的对象,通过在JST模型基础上加入对象层提出了一种无监督的对象情感联合模型(UOSU model),UOSU模型对每个词同时采样对象、情感和主题标签,最终得到各个主题的对象情感词以及文本的对象情感分布。在汽车评论数据集上进行的情感分类实验取得了74.19%的精确率和73.97%的召回率。
- 赵鸿艳王素格许超逸
- 关键词:情感分析主题
- 自动获取汉语词语搭配被引量:16
- 2006年
- 作为一种词汇现象,词语搭配在自然语言处理的许多领域具有重要的应用。本文对4种词语相关性度量和3种词语结构分布度量分别进行了比较分析,并提出了一种基于互信息与熵融合的获取词语搭配的方法。实验结果表明:在同现频率较高情况下,互信息、Cosine系数、x2测试和似然比测试4种相关性度量对搭配判定有大致相同的效果;在度量词语的结构分布方面,熵要优于方差和离散度。本文所提方法依赖度量指标少,阈值容易选取,且与其他已有的方法具有同等效果。
- 王素格杨军玲张武
- 关键词:计算机应用中文信息处理词语搭配互信息