国家自然科学基金(71203164)
- 作品数:16 被引量:125H指数:7
- 相关作者:刘萍刘勘郑凯伦邹德安范琴更多>>
- 相关机构:武汉大学中南财经政法大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金更多>>
- 相关领域:文化科学自动化与计算机技术社会学经济管理更多>>
- 基于随机森林分类的微博机器用户识别研究被引量:19
- 2015年
- 针对网络上机器用户大量散布谣言,发布虚假信息,误导网民舆论,严重影响网络环境的问题,以微博中的机器用户为研究对象,结合其自动化程度高、伪装能力强、信息发布有针对性的特点,从行为模式、微博内容、用户关系和发布平台4个维度分析机器用户的特征指标,利用信息熵、内容重复率等8个指标构建微博用户的特征向量,通过随机森林算法设计微博中机器用户的识别模型。最后,在真实的新浪微博数据集上进行验证,结果表明本模型识别机器用户的准确度达到96.7%,可以有效地区分微博中的机器用户和普通用户。
- 刘勘袁蕴英刘萍
- 链路结构的网页聚类研究被引量:1
- 2016年
- 网页的链接关系反映了网页之间联系的紧密程度,这种紧密关系是网页聚类的重要依据.首先通过对网页链路结构的特点分析,提出网页节点的基本集、扩展集、半径、邻域、密度和路径树等概念;然后,利用共享入度出度以及网页之间的相异度来衡量其距离,并结合扩展集中的链接信息设计了网页相似度的计算模型;最后,利用密度分布对网页进行聚类.实验结果表明,本算法具有较好的聚类效果.
- 刘勘范琴
- 关键词:WEB挖掘链接分析网页聚类
- 多维学术网络相关性分析——以图情学为例被引量:6
- 2016年
- 基于WOS平台的SCI和SSCI数据库,以其收录的16种LIS外文期刊于2001~2013年间的载文信息为数据样本,构建了基于作者的结构网络、共词网络、合著网络、引文网络、共被引网络和耦合网络,对网络总体特征进行分析、并利用QAP方法对6种网络进行网络关联分析以及以引文网络为因变量的回归分析。分析结果表明:不同维度的学术网络间存在一定的相关性;引文网络与共引网络间的相关性最大,耦合网络与其它网络的相关性不显著;通过QAP回归分析,在线性条件下,其它5种关系能以31.4%的效果对引文关系产生影响。
- 刘萍邹德安郑凯伦
- 关键词:图书情报学学术网络
- 基于链路结构的微博领域专家识别研究被引量:3
- 2016年
- 提出基于链路结构的微博领域专家识别算法,以新浪微博为例,通过多指标综合分析,设计了包括原创发博率、主题相关度、节点扩散度、交互主动性以及用户支持度等五个指标值,将节点的权重分为中心权重和权威权重两部分,分别采用上述指标值为其赋值,再根据用户的中心性和权威性相互增强的思想,迭代计算每个用户的领域中心值和领域权威值,直至算法收敛,最终利用领域权威值结果判断用户是否为领域专家。实验表明,本算法能准确地识别微博中某一领域的专家,并能对其影响力作出有效评判。
- 刘勘范琴
- 关键词:链接分析信息传播
- 基于本体的社会网络关系挖掘
- 2015年
- 文章建立了一个基于本体的社会网络关系挖掘框架,首先构建语义社会网络,利用本体为社会网络赋予计算机可理解的语义,接着进行基于本体的直接关系和间接关系的发现和测度,最后融合多关系得到成员关联强度。以一个科研网络为例论述了以上过程,并对结果进行了分析和评价。
- 刘萍马云路
- 关键词:语义网本体社会网络
- 一种探测组织知识结构的新方法:基于FCA的作者关键词耦合分析被引量:15
- 2012年
- 阐述作者关键词耦合和形式概念分析的基本原理,详细讨论在作者关键词耦合的基础上生成概念格的具体方法以及知识结构的建构过程。通过对该方法在某一科研组织中的应用举例,阐明该方法能够较好地揭示组织知识结构。与传统的共词分析方法相比,基于形式概念分析的作者关键词耦合分析方法层次化效果更清晰、人工干预程度更低。
- 刘萍王哲
- 关键词:形式概念分析知识结构
- 利用作者关键词网络探测作者相似性被引量:15
- 2013年
- 准确识别作者研究内容的相似度,是探测学科知识结构和挖掘潜在合作关系的重要基础工作,也是近年来图书情报学的研究热点。现有的相似度计算方法大都依赖于属性的直接关联,忽略属性间的间接关联。提出一种新的基于作者关键词网络的作者相似度计算方法,通过向量空间模型计算出关键词之间的关联度,再利用图结构相似度算法P-Rank挖掘出作者间的间接关联关系。初步实验表明该方法能够有效地识别作者之间的相似度,相比于传统的关键词耦合和向量空间模型算法,该方法可以明显地提高作者相似度计算的准确性。
- 刘萍郭月培郭怡婷
- 关键词:相似度P-RANK
- 基于社会资本的异构社会网络构建研究被引量:6
- 2013年
- 在图书情报领域,不同的知识单元(如文献、作者、机构、期刊、学科、主题词和关键词等)因各式各样的关联而形成了复杂的知识网络。传统的知识网络构建过程中往往仅依赖知识单元之间的单一关系,因而形成了多个独立的单关系网络,然而真实的知识单元之间往往是多种关系复杂地交织在一起。为解决复杂的知识网络构建这一问题,本文以科研人员这一知识单元为例,提出基于多关系融合的异构社会网络构建方法。将社会网络的构建与社会网络三大核心理论之一的社会资本理论相结合,依据社会资本的三个维度来进行关联测度和融合,生成异构社会网络。针对科研组织的实证研究揭示出异构社会网络能够更好地融合研究人员之间与科研兴趣有关的多种关联,为更精确的社区划分提供帮助。
- 刘萍陈枫琳
- 关键词:社会资本社会网络分析知识网络
- 基于共词网络的专家专长挖掘被引量:7
- 2012年
- 组织中专家专长的自动识别研究对组织保持组织竞争力具有重要作用,提出基于共词网络的专家专长挖掘方法。从专家相关文档集中抽取特征词形成共词网络,以社区划分的方法对词汇进行聚类,并根据点度中心度确定社区主题,从而自动识别专家专长。实验证明该方法能较好地揭示专家专长主题,精确度达到75.83%。
- 刘萍周梦欢
- 基于潜在语义索引的科技文献主题挖掘被引量:4
- 2014年
- 提出了一种基于潜在语义的科技文献主题挖掘方法,描述了科技文献的主题挖掘模型。对科技文献集进行预处理,计算特征词权重,构造出词汇-文献矩阵。用改进的LSI算法对稀疏矩阵进行降维得到固定的主题-文献矩阵。取权重最高的主题作为该文献的主题。该方法利用Frobenius范数来规范矩阵,对稀疏矩阵进行降维,可以快速精确地挖掘出科技文献的主题。
- 刘勘朱芳芳
- 关键词:潜在语义索引主题挖掘