您的位置: 专家智库 > >

张慧

作品数:7 被引量:73H指数:4
供职机构:北京工商大学计算机与信息工程学院更多>>
发文基金:国家自然科学基金北京市属高等学校科学技术与研究生教育创新工程建设项目教育部人文社会科学研究基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 6篇期刊文章
  • 1篇会议论文

领域

  • 5篇自动化与计算...
  • 1篇理学

主题

  • 2篇支持向量
  • 2篇支持向量机
  • 2篇知网
  • 2篇中文
  • 2篇自动机
  • 2篇文本倾向性
  • 2篇向量
  • 2篇向量机
  • 2篇词典
  • 1篇社团发现
  • 1篇神经网
  • 1篇神经网络
  • 1篇数据挖掘
  • 1篇最大期望算法
  • 1篇文本
  • 1篇模式识别
  • 1篇聚类
  • 1篇聚类算法
  • 1篇基于神经网络
  • 1篇EM算法

机构

  • 7篇北京工商大学

作者

  • 7篇张慧
  • 6篇韩忠明
  • 3篇黄今慧
  • 2篇万月亮
  • 2篇张梦
  • 2篇张玉沙
  • 1篇郭培源
  • 1篇陈妮
  • 1篇曲世海
  • 1篇李刚
  • 1篇杨伟杰
  • 1篇姜同强
  • 1篇吕涛

传媒

  • 1篇传感器技术
  • 1篇模式识别与人...
  • 1篇计算机应用与...
  • 1篇计算机应用研...
  • 1篇计算机科学
  • 1篇智能系统学报
  • 1篇2012中国...

年份

  • 1篇2015
  • 2篇2014
  • 1篇2013
  • 2篇2012
  • 1篇2005
7 条 记 录,以下是 1-7
排序方式:
有效的中文微博短文本倾向性分类算法
本文对具有对长度短、结构复杂以及变形词多等特点的短文本倾向性分类进行深入研究,目的是提高倾向性分类的准确性和效率。本文以HowNet的情感词典为基础,提出一个微博新词发现算法,构建微博情感词典。在对文本进行分句、分词、标...
韩忠明张玉沙张慧万月亮黄今慧
关键词:词典自动机知网支持向量机
基于内容的热点话题传播模型被引量:9
2013年
采用传染病模型对网络热点话题的传播进行建模具有重要的价值,但是现有的传染病模型并没有区分话题类型和不同用户传播话题的概率,为此提出一个基于内容的网络热点话题传播模型.模型中引入了用户对话题传播的敏感度,基于用户话题敏感度定义了单个用户传播话题的概率,融合话题的内容分类特性、用户传播概率、用户重入概率等因素,借鉴SIRS模型的基本思想,构建了话题传播模型(CSIRS).在无标度网络、小世界网络、随机网络和真实社会网络上作了不同实验,实验结果表明CSIRS模型不仅能够呈现一般传染病动力模型的传播模式,还能够呈现多个波动、小范围长时间传播、快速上升缓慢下降等社会网络热点话题的传播模式.该模型为融合网络结构和话题内容属性建模话题传播过程带来新的研究思路.
韩忠明张慧张梦
关键词:传染病模型
带隐变量的回归模型EM算法被引量:1
2014年
带有隐变量的回归模型具有非常广泛的应用场合,隐回归模型的参数求解问题依赖于自变量的分布假设。基于自变量的beta分布的假设条件,给出了隐回归模型的EM算法,详细地推导了模型中的参数求解过程,给出了使用牛顿法求解beta分布参数的算法,并提出一个合适的初值选择算法。在模拟数据和真实数据的基础上进行了详细的比较性试验,结果表明,对具有不同分布特征的因变量观察值,EM算法能够有效地求解隐回归模型的参数。
韩忠明吕涛张慧姜同强
关键词:最大期望算法
基于神经网络的肉类新鲜度辨识技术被引量:9
2005年
阐述了肉类新鲜度检测识别机理,构建了由气体传感器阵列、数据采集单元、神经网络组成的智能检测辨识系统。通过猪肉样本的测试与分析表明:该方法可实时准确地识别肉类新鲜度,辨识准确率可达90%以上。
李刚曲世海郭培源张慧
关键词:神经网络模式识别
有效的中文微博短文本倾向性分类算法被引量:40
2012年
对具有长度短、结构复杂以及变形词多等特点的短文本倾向性分类进行深入研究,目的是提高倾向性分类的准确性和效率。以HowNet的情感词典为基础,提出一个微博新词发现算法,构建微博情感词典。在对文本进行分句、分词、标注、情感处理等后,构建一个自动机来计算短文本情感倾向性。为了客观评价该方法,选择基于HowNet的分类方法、基于SVM的分类方法进行比较性实验。实验结果表明提出的方法在一般文本分类上与SVM效果类似,在短文本上则具有明显的优势。同时该方法在效率上也具有突出优势。
韩忠明张玉沙张慧万月亮黄今慧
关键词:词典自动机知网支持向量机
一种非对称距离下的层次聚类算法被引量:11
2014年
层次聚类算法在数据挖掘领域有着广泛应用,现有的层次聚类算法都依赖于对称距离定义.针对聚类对象的非对称距离下的层次聚类展开研究,提出完整的非对称距离下的层次聚类算法,给出聚类对象选择因子,并定义相应的计算方法.文中提出不同簇之间的合并方法,形成非对称距离下的单连接、全连接等算法.采集社会化书签系统中的热点标签,基于共现次数定义非对称距离,对所提出的算法进行大量实验,实验结果表明聚类结果与实际结果具有较高的一致性.对算法进行量化指标分析的结果也表明非对称层次聚类算法具有良好性能.
韩忠明陈妮张慧杨伟杰
关键词:层次聚类数据挖掘
大规模短文本的快速话题发现方法与评价研究被引量:3
2015年
传统的话题发现研究主要针对于长文本及新闻数据集,大规模短文本具有稀疏、无结构、多噪等特点,传统方法很难有效发现话题。提出了一个融合词共现与加权GN(CW-WGN)算法的快速话题发现方法,描述了CW-WGN方法的详细过程,给出方法的具体算法。采集了sina微博、新闻网站的标题真实的短文本数据,构建了基础测试数据集,采用LDA与K-means方法作为对比进行了大量对比实验。实验结果表明CW-WGN比LDA和K-means方法能够多发现20%以上的正确话题,而且发现的话题纯度也高于LDA与K-means。此外,CWWGN消耗的时间最少,能够有效地从实际大规模短文本上发现话题。
韩忠明张慧张梦黄今慧
关键词:词共现社团发现
共1页<1>
聚类工具0