您的位置: 专家智库 > >

蔡永明

作品数:2 被引量:8H指数:1
供职机构:济南大学商学院更多>>
发文基金:山东省社会科学规划研究项目济南市哲学社会科学规划项目更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇文化科学
  • 1篇自动化与计算...

主题

  • 2篇LDA
  • 1篇狄利克雷
  • 1篇热点词汇
  • 1篇中文
  • 1篇中文文本
  • 1篇主题分析
  • 1篇网络
  • 1篇股市
  • 1篇法学
  • 1篇法学文献
  • 1篇复杂网
  • 1篇复杂网络
  • 1篇LDA模型
  • 1篇词共现
  • 1篇词汇

机构

  • 2篇济南大学
  • 1篇山东交通学院

作者

  • 2篇蔡永明
  • 1篇马红
  • 1篇刘贵香

传媒

  • 1篇现代图书情报...
  • 1篇情报探索

年份

  • 2篇2016
2 条 记 录,以下是 1-2
排序方式:
基于LDA的股市复杂网络研究热点分析被引量:1
2016年
[目的/意义]挖掘股市复杂网络研究热点。[方法/过程]运用狄利克雷分配模型和Gibbs Sampling算法对我国股市复杂网络相关文献的摘要和关键词进行主题分析,获得股市复杂网络的热点词汇,并将热点词汇归类到相应的主题,从而推断出股市复杂网络研究热点。[结果/结论]股市复杂网络研究热点包括股票网络的拓扑性质、稳定性、社团结构以及利用神经网络进行股市预测。
马夏夏蔡永明刘贵香
关键词:热点词汇
共词网络LDA模型的中文文本主题分析:以交通法学文献(2000-2016)为例被引量:7
2016年
【目的】通过结合传统LDA模型的概率主题抽取方法和共词网络分析发现文献词汇间的联系结构的两者优势,降低由少量文献产生的高频词汇的干扰,提高主题凝聚性。【方法】在交通法学文献摘要文本主题分析中,加入文献的关键词作为分词复合词典,提高语义识别度;提出CA-LDA模型(Latent Dirichlet Allocation Model with Co-word Analysis),在传统LDA模型的基础上加入共词网络分析,以共词网络拓扑结构参数作为权重控制词汇主题分配(采用介数中心度),优先提取同时具有高共现性(中介性)和高频率的词汇。【结果】CA-LDA模型可以得到多篇文献同时共现的高频词汇,这样产生的重点词汇表对主题分析更有意义。该算法的结果不仅仅反映词频概率,同时也能从词汇关联上发现枢纽词汇,更深入理解该领域的研究热点。【局限】CA-LDA模型主题数目K的取值采用混淆度标准交叉验证获得,如果在实际分析中K值太大,不利于文献主题的分类整理,未来研究需要对该结果进一步处理来凝聚主题。【结论】本文将该模型应用于交通法学研究领域热点主题分析,在处理大规模文献数据中取得较好效果。相关研究可以拓展应用于各种领域的大规模文献数据自动化处理中。
马红蔡永明
共1页<1>
聚类工具0