王硕
- 作品数:2 被引量:37H指数:2
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:中国人民大学科学研究基金国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 社会媒体大数据分析研究综述被引量:13
- 2017年
- 社会媒体作为人们传播信息和表达观点的重要渠道,包含大量丰富的有用信息,近年来已成为大数据最具代表性的数据来源之一,挖掘与分析这些信息对社会发展影响深远。按照社交媒体的构成要素将目前研究划分为3类,即从基于用户的分析、基于关系的分析和基于交互内容的分析三方面进行总结分析。首先,从多源异构网络中识别用户身份,发现社群并计算用户影响力来分析基于用户的数据;其次,从用户关系强度计算、信息传播和影响力最大化3个角度探讨了基于交互关系为中心的数据分析;然后,基于用户交互内容探讨了特征提取与选择、话题事件挖掘、多媒体数据分析以及情感分析4个问题。最后,从信息传播、影响力计算、特征提取与选择、微博新闻挖掘、社会媒体大数据融合和跨语言情感分析6个方面指出了现有研究的挑战性和未来研究的新视角。
- 杜治娟王硕王秋月孟小峰
- 关键词:社交媒体大数据用户行为
- 大规模知识图谱补全技术的研究进展被引量:24
- 2020年
- 随着谷歌知识图谱、DBpedia、微软Concept Graph、YAGO等众多知识图谱的不断出现,根据RDF来构建的知识表达体系越来越为人们所熟知.利用RDF三元组表达形式成为人们对现实世界中知识的基本描述方式,由于其结构简单、逻辑清晰,所以易于理解和实现,但也因为如此,当其面对现实中无比繁杂的知识和很多常识时,往往也无法做到对知识的认识面面俱到,知识图谱的构建过程注定会使其中包含的知识不具有完整性,即知识库无法包含全部的已知知识.此时知识库补全技术在应对此种情形时就显得尤为重要,任何现有的知识图谱都需要通过补全来不断完善知识本身,甚至可以推理出新的知识.本文从知识图谱构建过程出发,将知识图谱补全问题分为概念补全和实例补全两个层次:(1)概念补全层次主要针对实体类型补全问题,按照基于描述逻辑的逻辑推理机制、基于传统机器学习的类型推理机制和基于表示学习的类型推理机制等3个发展阶段展开描述;(2)实例补全层次又可以分为RDF三元组补全和新实例发现两个方面,本文主要针对RDF三元组补全问题沿着统计关系学习、基于随机游走的概率学习和知识表示学习等发展阶段来阐述实体补全或关系补全的方法.通过对以上大规模知识图谱补全技术研究历程、发展现状和最新进展的回顾与探讨,最后提出了未来该技术需要应对的挑战和相关方向的发展前景.
- 王硕王硕孟小峰
- 关键词:知识图谱