国家自然科学基金(90924020)
- 作品数:15 被引量:476H指数:7
- 相关作者:刘鲁刘志明苗蕊熊海涛吴俊杰更多>>
- 相关机构:北京航空航天大学东北财经大学中国石油大学(北京)更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金北京市教育委员会科技发展计划面上项目更多>>
- 相关领域:经济管理自动化与计算机技术文化科学社会学更多>>
- 面向突发事件的群体情绪监控预警被引量:31
- 2010年
- 突发事件所引发的群体情绪可能会导致衍生群体事件的发生,所以有必要对群体情绪演化进行监控预警。本文对突发事件发生、发展过程中群体情绪的演化进行了研究,建立了面向突发事件的情绪层次模型以及情绪监控预警模型。通过支持向量机、贝叶斯文本分类算法、n元语言模型三种机器学习算法,以及CH I(卡方检验)、DF(文档频率)、IG(信息增益)三种特征选择方法对突发事件相关的微博评论进行了情绪分类的实验分析,实验结果表明支持向量机、IG取得的分类性能最优,得到的分类结果可以满足实际应用的需求。进而对王家岭矿难、山西疫苗两个突发事件进行了实际案例研究,建立并分析了情绪层次演化曲线。最后提出了群体情绪演化预警指标以及预警模式的概念。
- 刘志明刘鲁
- 关键词:机器学习方法预警指标
- 虚拟网络社会中的经济:机遇与挑战被引量:2
- 2011年
- 介绍虚拟网络社会的发展历史以及其对人们传统方式的深刻影响,深入探讨了虚拟网络社会所带来的经济增长模式的转变,并分析了虚拟网络社会经济发展所面临的历史性机遇与挑战。为政府和企业正确认识虚拟社会网络经济的价值提供了理论指导和政策参考。
- 许博刘鲁
- 关键词:虚拟经济在线社会网络
- Analysis Impact Factors of Trust of Emergent Events on Web Diffusion Channels
- <正>In order to save lives and reduce losses in emergencies, it is significant of disseminating warming informa...
- Lin Jiajia School of Economics and Management Beihang University Beijing
- 文献传递
- 基于Squeezer算法的文本数据流聚类被引量:3
- 2012年
- 为解决数据流聚类中的"链式数据"问题以及文本数据流存在的高维、稀疏、多主题问题,以Squeezer聚类算法为基础,重新定义了聚类过程中类的质心、半径和判别距离.提出了一种改进算法,通过加入数据预处理环节来提高聚类精度,通过投影聚类提高聚类效率并为簇赋予语义.最后通过在互联网新闻语料的聚类实验,表明了所提出的算法能够以较小的速度代价换来聚类效果的大幅提升,性能显著优于Squeezer算法.
- 尤薇佳刘鲁刘丹李明
- 关键词:投影聚类
- 微博网络舆情中的意见领袖识别及分析被引量:214
- 2011年
- 从用户影响力和用户活跃度两个角度考虑,构建了微博意见领袖指标体系,提出了使用层次分析法和粗糙集决策分析理论对意见领袖的特征进行识别及分析的理论框架。对3起突发事件微博数据进行了实证分析,通过观察法分析了Top 10意见领袖具有的特征,使用粗糙集理论对意见领袖识别问题进行了建模,并提取了识别意见领袖的决策规则。另外,通过定义意见领袖一致性和排名稳定性两个指标分析了意见领袖的跨主题性,实验结果表明意见领袖是主题依赖的,只有很少用户可以在不同主题同时成为意见领袖。
- 刘志明刘鲁
- 关键词:突发事件意见领袖网络舆情
- 银行间市场体系的相继违约风险分析与建模被引量:5
- 2011年
- 总结分析当今世界各主要经济体的银行间市场体系的网络结构特征,指出随机网络和无标度网络是目前各国银行间市场的主要网络结构形态。并进一步通过模型说明和数值仿真揭示了这两种不同的网络体系下银行间市场的相继违约风险发生过程和演化特征,分析了网络结构对于银行体系风险的影响,指出无标度的银行体系结构会带来更大的相继违约风险。
- 许博刘鲁
- 关键词:系统性风险
- 分类中的类重叠问题及其处理方法研究被引量:9
- 2013年
- 类重叠问题是数据挖掘与机器学习领域的瓶颈问题之一.如果其中还存在类不均衡问题时,情况变得更加复杂.有鉴于此,本文在已有文献基础上归纳了三种类重叠学习算法及提出一种新的方法:分隔法,并首次将支持向量数据描述算法用于实际数据的重叠样本识别,对类重叠问题及其与类不均衡问题的相互影响进行了系统研究.在真实数据上采用五种分类器的实验结果表明:1)多数情况下"分隔法"是表现最佳的类重叠学习算法;2)分隔法通常对基于分界面而非规则的分类器更为有效;3)分隔法在类不均衡问题中表现很好,当基础分类器为支持向量机时尤为突出.最后针对支持向量机的实验结果给出了理论分析.
- 熊海涛吴俊杰刘洪甫刘鲁
- 关键词:数据挖掘支持向量数据描述
- 基于机器学习的中文微博情感分类实证研究被引量:126
- 2012年
- 使用三种机器学习算法、三种特征选取算法以及三种特征项权重计算方法对微博进行了情感分类的实证研究。实验结果表明,针对不同的特征权重计算方法,支持向量机(SVM)和贝叶斯分类算法(Nave Bayes)各有优势,信息增益(IG)特征选取方法相比于其他的方法效果明显要好。综合考虑三种因素,采用SVM和IG,以及TF-IDF(Term Frequency-Inverse Document Frequency)作为特征项权重,三者结合对微博的情感分类效果最好。针对电影领域,比较了微博评论和普通评论之间分类模型的通用性,实验结果表明情感分类性能依赖于评论的风格。
- 刘志明刘鲁
- 关键词:情感分类特征选取特征项权重
- 基于改进模糊信息公理的知识管理系统选择方法被引量:1
- 2010年
- 知识管理系统的选择对知识管理的绩效有着重要的影响,针对这一重要问题,提出了基于改进模糊信息公理的知识管理系统选择方法。改进了模糊信息公理的排序机制,提出了差异信息量的概念,作为对信息量无穷大的系统排序的指标,提高了排序的精确度。在此基础上提出了基于模糊信息公理的模糊语言多属性群决策方法,实现了通过多个专家的模糊语言评价信息对知识管理系统的选择。通过实例说明了方法的有效性和可操作性。
- 李明刘鲁李传博李传博
- 关键词:信息公理模糊语言
- 基于隐马尔可夫模型的突发事件新闻报道的爆发性分析被引量:4
- 2010年
- 突发事件新闻报道数量的变化反映了突发事件自身发展态势以及媒体和公众对事件的反应的变化,是应急管理决策信息的重要来源。本文基于隐马尔可夫模型对突发事件新闻报道的爆发性进行了建模,以反映突发事件新闻报道数量的变化趋势。本文还提出了使用时间序列聚类算法去识别突发事件新闻报道数量的演化模式。对28起突发事件新闻报道的实验分析表明,本文提出的爆发性建模方法能够详细和准确地描述突发事件新闻报道数量的变化。此外,本文从这28起突发事件新闻报道数量的时间序列中识别了四类演化模式并分析了每一类的特征。
- 苗蕊刘鲁刘志明
- 关键词:管理工程隐马尔可夫模型突发事件新闻报道