您的位置: 专家智库 > >

王素格

作品数:157 被引量:508H指数:12
供职机构:山西大学计算机与信息技术学院更多>>
发文基金:国家自然科学基金山西省自然科学基金山西省科技攻关计划项目更多>>
相关领域:自动化与计算机技术理学社会学一般工业技术更多>>

文献类型

  • 103篇期刊文章
  • 20篇专利
  • 17篇会议论文
  • 2篇学位论文

领域

  • 122篇自动化与计算...
  • 2篇社会学
  • 1篇经济管理
  • 1篇医药卫生
  • 1篇一般工业技术
  • 1篇文化科学
  • 1篇语言文字
  • 1篇理学

主题

  • 20篇文本
  • 17篇情感
  • 16篇情感分类
  • 14篇抽取
  • 13篇聚类
  • 12篇网络
  • 11篇神经网
  • 11篇神经网络
  • 11篇中文
  • 11篇注意力
  • 11篇向量
  • 11篇粗糙集
  • 10篇识别方法
  • 10篇搭配
  • 8篇语言
  • 8篇情绪
  • 8篇自然语言
  • 8篇文本情感
  • 8篇旅游
  • 8篇卷积

机构

  • 140篇山西大学
  • 9篇山西财经大学
  • 8篇上海大学
  • 3篇太原师范学院
  • 3篇石家庄铁道大...
  • 2篇上海师范大学
  • 2篇太原科技大学
  • 2篇同济大学
  • 2篇科学出版社
  • 2篇北京市律典通...
  • 1篇西安交通大学
  • 1篇教育部
  • 1篇山西职工医学...
  • 1篇信息技术有限...

作者

  • 142篇王素格
  • 53篇李德玉
  • 15篇陈千
  • 14篇陈鑫
  • 10篇李旸
  • 9篇廖健
  • 8篇郭鑫
  • 7篇宋晓雷
  • 6篇郑建兴
  • 5篇张武
  • 5篇杨安娜
  • 4篇张永奎
  • 4篇张鹏
  • 4篇翟岩慧
  • 4篇李艳红
  • 4篇李艳红
  • 4篇张晶
  • 4篇李华
  • 3篇谭红叶
  • 3篇魏英杰

传媒

  • 35篇中文信息学报
  • 14篇计算机工程与...
  • 8篇电脑开发与应...
  • 8篇计算机科学
  • 5篇计算机应用与...
  • 3篇南京大学学报...
  • 3篇计算机应用
  • 3篇郑州大学学报...
  • 2篇计算机研究与...
  • 2篇模式识别与人...
  • 2篇清华大学学报...
  • 2篇小型微型计算...
  • 2篇中北大学学报...
  • 1篇系统科学与数...
  • 1篇数据采集与处...
  • 1篇计算机工程与...
  • 1篇计算机工程
  • 1篇情报学报
  • 1篇软件学报
  • 1篇黑龙江高教研...

年份

  • 2篇2024
  • 11篇2023
  • 13篇2022
  • 7篇2021
  • 9篇2020
  • 7篇2019
  • 11篇2018
  • 10篇2017
  • 6篇2016
  • 10篇2015
  • 5篇2014
  • 6篇2013
  • 5篇2012
  • 6篇2011
  • 6篇2010
  • 7篇2009
  • 3篇2008
  • 3篇2007
  • 5篇2006
  • 1篇2005
157 条 记 录,以下是 1-10
排序方式:
文本褒贬倾向判别研究
2011年
在文本的向量空间表示模型下,针对文本褒贬倾向判别问题,提出了一种基于潜在语义分析的特征权重计算方法。除词频信息外,该方法考虑了潜在语义分析所提供的同义词、近义词信息对特征权重的影响。采用基于Fisher判别准则的特征选择方法,以支持向量机作为分类器,在2739篇语料(2008年中文倾向性分析评测)上进行了实验。实验结果表明,提出的特征权重计算方法对文本褒贬倾向判别是有效的。
李银花王素格
关键词:概率潜在语义分析FISHER判别准则支持向量机
汉语词性自动标注系统的设计与实现被引量:7
2001年
介绍了汉语词性自动标注系统的设计与实现.该系统实现了统计与规则相结合的方法进行汉语词性自动标注.描述了该系统的总体结构,以及所使用的非兼类词表、兼类词表、标记集和词性标注规则的组织,特别对稀疏矩阵及其存储方法进行了详细的介绍。
王素格张永奎
关键词:自然语言理解语料库神经网络
一种SNESIM多点模拟结果不确定性评估方法
一种SNESIM多点模拟结果不确定性评估方法:(1)在进行多点模拟之前,根据训练图像和模板对模拟结果事前进行图像级不确定性评价;(2)在得到多点模拟结果之后,对模拟结果进行像元级不确定性评价。本发明能够有效的评价多点模拟...
白鹤翔王素格李艳红李德玉翟岩慧
文献传递
一种文本对话的情绪识别与预测方法
本发明涉及文本交互应用开发技术领域,公开了一种文本对话的情绪识别与预测方法,包括用于文本对话情绪识别任务的交互式双状态情绪细胞模型和用于文本对话情绪预测任务的交互式双状态情绪细胞模型,用于文本对话情绪识别任务的交互式双状...
李大宇李旸王素格
文献传递
基于最大熵模型与投票法的汉语动词与动词搭配识别被引量:6
2007年
提出一种基于最大熵模型和投票法的汉语动词与动词搭配识别方法.该方法通过组合目标动词与候选搭配词的上下文词性信息以及关联程度的统计信息构成5种复合特征模板,然后利用最大熵方法获得它们对应搭配识别器,最后采用最好搭配识别器占优的投票法构造组合识别器.实验结果表明,同时包含上下文词性信息和统计信息的识别器优于单纯包含上下文词性信息或统计信息的识别器,但最好搭配识别器占优的组合识别器效果更佳.
王素格杨军玲张武
关键词:搭配最大熵模型特征函数投票法
文本流多粒度主题结构建模研究被引量:2
2015年
主题检测近年来在文本挖掘和自然语言处理领域得到了广泛的应用,对主题进行结构建模是主题检测的基础。为了对文本流中的多粒度主题进行建模,提出一种基于语义层次树的主题结构模型。该模型利用领域本体的特点,将主题同本体作一一映射,结合概率理论,将概念集里的概念用主题树的叶子节点表示,每一层中的节点均是下一层节点的多项分布,使之更适合描述文本流中多粒度的主题结构。为了便于构建主题的空间结构,提出主题的相似度和事件相关度计算方法。该文结尾设计了实验构造真实新闻文本流数据上的主题树。实验结果表明,该结构模型能够体现主题丰富的多粒度空间语义特征。
陈千郭鑫王素格张虎
关键词:主题检测
基于模糊不一致对的多标记属性约简被引量:1
2020年
在实际生活当中,存在着大量的高维多标记数据,为解决维度灾难问题,通常需要约简属性集。针对目前的多标记属性约简算法未考虑标记关系问题,本文提出了一种融合标记关系的模糊不一致对多标记属性约简算法。利用相对熵(KL散度)度量标记之间的关系,定义标记权重,结合标记权重,定义模糊不一致对,考虑到属性对于模糊不一致对的区分性,定义属性重要性并进行属性约简。在8个数据集上的对比实验表明,所提基于模糊不一致对的多标记属性约简算法优于当前的多标记属性约简算法。
高琪李德玉王素格
关键词:属性约简KL散度模糊粗糙集区分矩阵
汉语动词-动词搭配规则与分布特征被引量:8
2005年
搭配是汉语自动句法分析的重要知识源,而动词是句法分析的核心和前提。论文面向中文信息处理,通过对真实文本的统计分析归纳了用于自动获取搭配的规则,研究了动词-动词搭配中各关系类型的分布特征以及搭配词语的位置分布特征,在此基础上提出了抽取动宾、动补、连谓和并列四种关系的动词-动词搭配的适宜观察窗口。
由丽萍王素格
关键词:词语搭配语料库中文信息处理
基于概率图模型的文本对象情感分析
2014年
情感分析旨在从文本数据中自动识别主观情感,即文本中表达的观点、态度、感受等,在线评论通常都涉及特定的对象,通过在JST模型基础上加入对象层提出了一种无监督的对象情感联合模型(UOSU model),UOSU模型对每个词同时采样对象、情感和主题标签,最终得到各个主题的对象情感词以及文本的对象情感分布。在汽车评论数据集上进行的情感分类实验取得了74.19%的精确率和73.97%的召回率。
赵鸿艳王素格许超逸
关键词:情感分析主题
自动获取汉语词语搭配被引量:16
2006年
作为一种词汇现象,词语搭配在自然语言处理的许多领域具有重要的应用。本文对4种词语相关性度量和3种词语结构分布度量分别进行了比较分析,并提出了一种基于互信息与熵融合的获取词语搭配的方法。实验结果表明:在同现频率较高情况下,互信息、Cosine系数、x2测试和似然比测试4种相关性度量对搭配判定有大致相同的效果;在度量词语的结构分布方面,熵要优于方差和离散度。本文所提方法依赖度量指标少,阈值容易选取,且与其他已有的方法具有同等效果。
王素格杨军玲张武
关键词:计算机应用中文信息处理词语搭配互信息
共15页<12345678910>
聚类工具0