您的位置: 专家智库 > >

黄佳佳

作品数:7 被引量:53H指数:3
供职机构:武汉大学计算机学院更多>>
发文基金:国家自然科学基金湖北省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 2篇专利
  • 1篇学位论文

领域

  • 5篇自动化与计算...

主题

  • 3篇社交
  • 2篇社交网
  • 2篇社交网络
  • 2篇主题抽取
  • 2篇专家知识
  • 2篇网络
  • 2篇文本
  • 2篇聚类
  • 2篇活动网络
  • 2篇抽取
  • 1篇信息提取
  • 1篇社交媒体
  • 1篇社群
  • 1篇识别方法
  • 1篇频繁项
  • 1篇频繁项集
  • 1篇谱聚类
  • 1篇主题
  • 1篇主题模型
  • 1篇文本聚类

机构

  • 7篇武汉大学

作者

  • 7篇黄佳佳
  • 6篇彭敏
  • 4篇黄济民
  • 3篇朱佳晖
  • 2篇汪清
  • 2篇武斌
  • 2篇刘纪平
  • 1篇谢倩倩
  • 1篇傅慧
  • 1篇高望

传媒

  • 2篇计算机工程
  • 1篇计算机研究与...
  • 1篇武汉大学学报...

年份

  • 3篇2016
  • 3篇2015
  • 1篇2013
7 条 记 录,以下是 1-7
排序方式:
基于回归模型与谱聚类的微博突发话题检测方法被引量:3
2015年
微博社交网络短文本具有数据规模巨大、快速传播、模态多样、质量较低等特性,导致现有传统的话题检测与跟踪技术在对其进行数据处理时面临复杂度高、特征稀疏和噪声干扰等问题。为此,提出一种在回归预测和谱聚类基础上的突发话题检测方法。该方法针对关键词词频变动趋势,基于回归模型,量化微博关键词的突发程度,从词频趋势分析的角度准确地提取出突发词集合。设计一个基于谱聚类思想的突发词聚类方法提高聚类结果的准确性。在大规模微博数据集的实验结果证明,与baseline方法相比,该方法的准确率、召回率、F值都有较大提高,在微博信息分析领域有着较好的应用前景。
彭敏张泰玮黄佳佳朱佳晖黄济民
关键词:词频分析谱聚类大数据
一种社交网络重要目标及社区群体识别方法
本发明提供一种社交网络重要目标及社区群体识别方法,首先将用户的静态好友网络和活动网络结合起来构建动态社交网络拓扑;其次提出InfluenceRank算法,对动态社交网络中的用户影响力进行综合打分,降低和核心用户交互频率低...
彭敏武斌汪清黄佳佳代心媛
文献传递
一种社交网络重要目标及社区群体识别方法
本发明提供一种社交网络重要目标及社区群体识别方法,首先将用户的静态好友网络和活动网络结合起来构建动态社交网络拓扑;其次提出InfluenceRank算法,对动态社交网络中的用户影响力进行综合打分,降低和核心用户交互频率低...
彭敏武斌汪清黄佳佳代心媛
文献传递
基于频繁项集的海量短文本聚类与主题抽取被引量:31
2015年
社交网络短文本规模大、传播快、质量低、模态多样等特性导致现有基于向量空间模型的文本聚类技术在对其进行聚类时面临维度高、特征稀疏和噪声干扰等挑战.对此,提出基于频繁项集的短文本聚类与主题抽取STC-TE(short text clustering&topic extraction)框架.首先研究短文本的多特征对文本质量的影响,在基于高质量短文本集挖掘出的大量频繁项集基础上,设计基于相似度的频繁项集过滤策略SIF(similarity-based itemset filtering),可过滤掉85%的非重要频繁项集;然后定义基于相关文本集的频繁项集相似度,并提出聚类个数自适应的频繁项集谱聚类算法CSA_SC(clusters self-adaptive spectral clustering),实现频繁项集聚类与主题抽取;最后基于主题词将大规模短文本划分到相应的主题簇中,从而实现短文本聚类.基于100万条新浪微博文本的实验结果表明。
彭敏黄佳佳朱佳晖黄济民刘纪平
关键词:海量频繁项集聚类主题抽取
基于核主成分分析与小波变换的高质量微博提取被引量:5
2016年
在线社交媒体中存在大量的噪音和冗余信息,为对其进行过滤和筛选,获取高质量的信息,提出基于核主分析和小波变换的高质量微博提取框架,并设计一种基于多特征融合的高质量信息的提取算法,将信息特征转换到小波域以更好地捕获信号间的细节差异。利用最大期望算法度量各个特征的权值,进一步融合得到特征综合值。为降低噪声特征对信息质量提取的影响并提高算法运算速度,引入核主成分分析对特征进行变换。实验结果表明,该框架能够提取出更高质量的微博,并且大幅减少运算时间。
彭敏傅慧黄济民黄佳佳刘纪平
关键词:信息提取小波变换核主成分分析
面向微博文本的主题探测与追踪研究
微博平台已发展成为网民讨论社会热点事件和分享日常生活的重要社交平台之一。这些用户产生的内容(user generated contents,UGCs)在微博平台上以数据流的形式实时产生和动态更新。快速变化的微博流使得我们...
黄佳佳
关键词:主题抽取
文献传递
面向社交媒体文本的话题检测与追踪技术研究综述被引量:14
2016年
以微博、论坛等为代表的社交媒体已逐渐发展成为网络用户表达和交流观点、获取和传播信息的重要平台.然而,社交媒体文本内容具有的规模庞大、形式多样、传播迅速等特点,对传统的应用在新闻报道、舆情监控、文本挖掘、信息咨询等方面的话题检测与追踪技术提出了新的要求.针对这一背景,本文分别从离线话题检测、在线话题检测和话题演化追踪这三个方面总结当前主要的话题检测与追踪方法,分析在该领域实验中被普遍使用的评估方式,最后提出当前面临的挑战和今后的研究方向.
彭敏官宸宇朱佳晖谢倩倩黄佳佳黄济民杨绍雄高望应称
关键词:社交媒体主题模型
共1页<1>
聚类工具0