国家自然科学基金(61272367)
- 作品数:27 被引量:165H指数:9
- 相关作者:叶施仁杨长春王晖朱明峰周猛更多>>
- 相关机构:常州大学江苏医药职业学院更多>>
- 发文基金:国家自然科学基金江苏省科技厅基金江苏省研究生培养创新工程项目更多>>
- 相关领域:自动化与计算机技术文化科学电子电信自然科学总论更多>>
- 基于weight-pooling词向量的上下文广告推荐算法被引量:1
- 2016年
- 提出一种基于weight-pooling词向量的上下文广告推荐算法,利用用户访问记录的互信息权重,计算weight-pooling词向量的余弦相似度。该算法改进了传统基于关键词匹配的推荐算法,避免了数据稀疏性和冷启动问题。通过实验分析,基于weightpooling词向量的上下文广告推荐算法在推荐效果上明显优于传统算法。
- 杨长春王俊袁敏雷晨阳
- 关键词:相似度
- 基于PSO-SVM算法的长微博贴图识别方法被引量:1
- 2013年
- 微博由于字数的限制,当用户需要发较多内容时通常以附图的形式给出,识别包含文本内容贴图的长微博能够为微博研究提供更多有用的数据。在支持向量机(SVM)的基础上结合粒子群算法(PSO)提出了一种识别长微博贴图的PSO-SVM算法。该方法提取长微博贴图的颜色矩和灰度共生矩阵特征,然后利用PSO算法对SVM模型中的误差惩罚参数和核函数进行优化得到最佳分类模型,其最优参数将被用作长微博贴图和非长微博贴图进行分类。实验表明,与传统的基于网格搜索法优化的SVM算法相比,PSO-SVM算法对长微博贴图识别具有更高的准确率和召回率。
- 刘平叶施仁杨长春侯振杰肖飞
- 关键词:支持向量机粒子群优化算法
- 基于fcmpCNN模型的网络文本情感多分类标注被引量:2
- 2018年
- 针对网络文本情感分析,提出了一种基于全卷积—多池化单元的卷积神经网络模型,实现情感多分类标注。无须手动指定多种上下文窗口大小和尽量保留文本的多层次语义,模型通过堆叠多级全卷积—多池化单元,提取出文本特征向量。该文本特征向量包含多个抽象级别、多种上下文窗口大小和不同层次语义的文本特征。模型最后基于此向量计算情感多分类标注。实验表明,模型的网络文本情感多分类标注正确率达到56. 3%,与同类模型比较,提高了情感多分类标注的正确率。
- 周锦峰叶施仁王晖
- 关键词:情感分析卷积神经网络
- 基于Lex-PageRank的微博摘要优化方法被引量:1
- 2016年
- 当前,由于全民自媒体兴起而引发了巨大的舆情危机,如何高效快速地从海量的碎片化信息中发现热点并抽取实用信息成为一项重大的挑战。在此背景下,提出一种基于Lex-PageRank的微博摘要优化方法,在该方案中,以聚类结果作为实验数据,从微博影响力周期的时间特性和权重属性考虑,提出改进的Lex-PageRank算法,从聚类结果中抽取若干文本组织生成摘要。在新浪微博数据基础上进行的对比实验表明,本方案可以有效地从大量文本中提取出关键信息。
- 朱明峰叶施仁叶仁明
- 基于改进完全子图模型的关注对象多社区发现研究
- 2016年
- 为实现用户和关注对象的多社区划分,针对完全子图模型不能进行多类分类的缺陷,该文引入了阈值划分方法,提出基于改进完全子图模型的社区发现算法。实验表明:与经典数据挖掘算法K-medoids相比,该文算法具有更高的准确性。
- 封红旗雷晨阳沈田予杨长春
- 关键词:数据挖掘算法
- 一种新的微博社区发现算法
- 2017年
- 在舆情分析、微博营销和个性化推荐等方面,微博社区发现的研究都具有重要的应用价值。为了准确而有效地发现微博社交网络中的社区,提出一种基于信任关联度的微博社区发现算法(TRKM算法)。该算法通过微博用户的评论、转发、原创微博等属性来构造节点间信任关联度,再利用微博社区的模块度对网络社区划分效果进行评价。在新浪微博明星和普通用户数据集上进行实验,并将TRKM算法与传统K-means算法作比较。实验表明,该算法能够更有效地发现微博用户关系网络中的社区结构。
- 杨长春刘玲李雪佳吕晨顾寰
- 一种新的新浪微博好友推荐算法被引量:5
- 2014年
- 鉴于新浪微博现有好友推荐机制的不足,提出一种新的新浪微博好友推荐算法。研究微博社区结构和权威用户对好友推荐的影响。在同一微博社区中,通过查找权威用户,并结合用户之间的兴趣相似度和信任度进行好友推荐。推荐过程中两次计算了用户的兴趣相似度并引入用户间信任度传播模型。通过跟踪多组新浪微博目标用户,将新浪微博提供的好友推荐列表和该算法推荐的好友列表作对比,实验表明该算法具有更好的推荐效果。
- 杨长春杨晶丁虹
- 关键词:兴趣相似度信任度
- 关于微博平台特征信息优化检测仿真研究
- 2017年
- 对微博平台特征信息优化检测的研究,可对海量微博信息中所需信息进行高效检索。对特征信息优化检测的过程,需要对信息重排,并进行主成分特征提取,完成对特征信息的检测。传统方法结合相关性检验,对样本信息流进行处理和分析,但忽略了对信息的主成分进行特征提取,导致检测精度偏低。提出基于萤火虫优化神经网络的微博平台特征信息优化检测仿真。采用自回归移动平均模型对统计得到的微博平台特征信息进行信息重排,对重排的微博特征信息信息流采用神经网络训练方法进行主成分特征提取,对提取的主成分特征采用优化的萤火虫算法进行特征筛选和自组织监督学习,实现微博平台信息的优化检测。仿真结果表明,采用上述方法进行微博信息准确检测准确度较高,需要的先验样本知识相对较小,检测的可靠度得到保证。
- 陆含波杨长春
- 关键词:特征信息
- 基于网络关系的微博水军集团发现方法被引量:7
- 2017年
- 由于目前水军的高伪装性,经典的水军识别算法变得不再有效。与真实用户相同,水军用户之间也会形成一定的网络结构,提出了一种基于网络关系的方法来发现水军集团,首先以一个典型的水军账号作为种子,逐层扩展粉丝关系,优先搜索出现次数频繁的用户,从而获得一个包含大量水军账号的集合,按照水军用户之间关系的高度聚集性以及与真实用户之间关系稀疏性的特点,用Fast Unfolding算法进行社区检测。实验结果表明,该方法能够很好地发现水军集团。
- 叶施仁叶仁明朱明峰
- 关键词:网络关系
- 孤立点预处理和Single-Pass聚类结合的微博话题检测方法被引量:12
- 2016年
- 针对如何快速发现微博中的热点话题,提出了一种具有更高准确率的中文微博话题检测方案。首先,优化了微博文本的特征选择,经过分析获得的这些博文特征有助于不同词性对话题表达的重要性;其次,在此基础上,提出了通过计算博文阈值的方法,将零散主题的博文作为噪声过滤,并用来降低博文集的维度;在现有Single-Pass聚类算法的基础上,引入了主题词的概念,根据中心向量的特征权重选择主题词,最终形成一种孤立点预处理与Single-Pass相结合的微博话题检测方法。实验结果表明,相比传统的Single-Pass算法,该方法有效去除了数据集的大部分孤立点,不仅具有较低的漏检率和误检率,而且在时间损耗方面表现更佳。
- 叶施仁杨英杨长春朱明峰
- 关键词:增量聚类孤立点