陈军营
- 作品数:4 被引量:73H指数:3
- 供职机构:山东理工大学科技信息研究所更多>>
- 发文基金:国家社会科学基金教育部人文社会科学研究基金山东省软科学研究计划更多>>
- 相关领域:文化科学更多>>
- 中外图情领域大数据近十年(2007-2016)研究现状与发展趋势分析被引量:12
- 2018年
- 【目的/意义】为揭示中外图书情报领域对大数据研究的现状和发展趋势,挖掘研究热点主题及其演化过程。【方法/过程】文章统计分析了近十年图情领域大数据研究的论文发文数量、核心机构和核心作者等指标,采用文本数据挖掘的方法识别出不同领域时期的研究热点主题,并分析了随时间的推移研究主题的演变情况。此外,论文还对比分析了中外图情领域研究主题的相关性和差异性,展现出中外图情领域对大数据研究的联系和区别。【结果/结论】随着时间的发展,中外大数据研究主题趋于相似。大数据研究主题的趋势向着研究主题多元化,结构层次鲜明化的方向发展,在未来几年将会有更多新颖的研究主题产生。
- 陈军营白如江王效岳刘自强
- 关键词:大数据热点主题数据挖掘
- 基于引文内容挖掘的科技创新路径识别方法与开源工具研究被引量:2
- 2018年
- [目的/意义]分析科技创新路径识别研究中用到的主要研究方法与开源工具,提出利用引文内容挖掘实现科技创新路径识别方法及开源工具。[方法/过程]首先,基于引文分析、结构洞分析、凝聚子群分析、文本内容挖掘、引文内容挖掘等不同角度分析了科技创新路径识别的主要方法;其次,从数据源、文本格式、挖掘内容、处理能力等方面阐述了用于实现引文内容挖掘的科技创新路径识别的3个开源工具:Mallet、Knime、NLTK;最后,分析了实现科技创新路径可视化的5个开源工具:Pajek、Ucinet、Gephi、D3.js、VOSViewer。[结果/结论]通过研究发现,利用开源工具深入挖掘引文内容中蕴含的丰富语义信息,识别不同引用动机,进而进行可视化展示可以有效的实现科技创新路径表达。
- 廖君华陈军营白如江
- 关键词:引文分析自然语言处理开源工具
- 基于基金项目数据的研究前沿主题探测方法被引量:37
- 2017年
- [目的 /意义]根据基金项目数据的特点,提出基于基金项目数据的研究前沿主题探测方法,以期识别出前瞻价值更高的研究前沿,为研究前沿识别相关研究提供借鉴思路。[方法/过程]首先,基于PLDA模型识别蕴含在基金项目文本中的研究主题;然后基于主题-文档矩阵建立主题和基金项目文档的映射关系,在此基础上,利用主题的资助时间、资助金额和中心性指标进行研究前沿主题探测,从而识别出值得关注的研究前沿主题;最后,利用主题演化可视化分析方法,对研究前沿主题进行演化分析,以预测其发展趋势。[结果 /结论]研究结果表明,该方法可以根据基金项目数据的特点识别出蕴含在其中的研究前沿主题,并且能够分析研究前沿主题的分裂、融合等演化过程。
- 王效岳刘自强白如江徐路路陈军营
- 关键词:指标体系可视化
- 基于引文内容分析的引用情感识别研究被引量:22
- 2018年
- [目的/意义]针对自动识别论文引用情感问题,提出一种基于引文内容分析的识别方法并进行可视化展示,克服基于简单引用频次计量无法区分不同引用情感的问题。[方法/过程]首先,利用正则表达式抽取出论文全文中的引文内容信息;然后,利用TF-IDF算法筛选出引用情感特征词,结合情感词典,利用情感分析技术对引文内容进行引用情感识别;最后,利用可视化工具展示出引用情感整体分布情况。[结果/结论]该方法能够有效识别出抗衰老领域论文数据集中引用情感情况。实验结果显示,该领域正面引用占总引用次数的21%,中立引用占总引用次数的78%,负面引用仅占总引用次数的l%。与传统引文网络相比较,基于引用情感的可视化图谱可以有效识别出不同引用情感在整体数据集合上的分布情况。
- 廖君华刘自强白如江陈军营
- 关键词:情感分析可视化