李晨亮
- 作品数:14 被引量:4H指数:1
- 供职机构:武汉大学更多>>
- 发文基金:国家自然科学基金湖北省自然科学基金深圳市科技计划项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于梯度相似性的自动作文评分多主题联合预训练方法
- 2022年
- 提出了一种基于梯度相似性的自动加权方法,用于作文评分的多主题联合预训练。在预训练阶段同时使用多个主题的数据,通过计算外部主题的训练样本的梯度向量与目标主题的梯度向量之间的相似度作为该样本的损失权重。将深度学习与特征工程相结合,手工设计了3类特征。在公开数据集上进行对比实验表明,与现有的基线模型相比,提出的多主题联合预训练方法和手工特征均能有效提升作文评分模型的评分准确性。
- 李晨亮李晨亮
- 关键词:自动作文评分
- 一种英文微博中地理兴趣点抽取和感知其时间趋势的方法
- 本发明公开了一种抽取英文微博中地理兴趣点和感知其时间趋势的方法,本发明首先对一条英文微博进行扫描,确定其中包含的候选地理兴趣点;然后从微博中抽取词汇,语法和BILOU模式标记三类特征;基于三类特征,运用时间趋势地理兴趣点...
- 李晨亮孙爱欣
- 一种基于类别相关单词的短文本过滤与分类方法
- 本发明公开了一种基于类别相关单词的短文本过滤与分类方法,将传统主题模型的主题根据功能分成“类别主题”和“普通主题”;构造伪文本集,并以伪文本集作为模型的训练集对SSCF进行训练。训练结束后计算两类主题各自的词分布,并根据...
- 李晨亮张芷芊陈诗倩
- 文献传递
- 一种基于单词语义相似度的短文本主题建模方法
- 本发明公开了一种基于单词语义相似度的短文本主题建模方法,根据外部提供的单词语义相似度,构建短文本集中单词的相似词集;确定建模采用的主题数;随机分配各个短文本的主题;通过吉布斯采样过程迭代地确定各个短文本的主题和单词在主题...
- 李晨亮王浩然张芷芊孙爱欣
- 文献传递
- 基于二阶段迭代的非负矩阵分解的分类模型被引量:2
- 2020年
- 为了有效地结合标签信息与非负矩阵分解技术,提升现有的非负矩阵分解算法划分数据的性能,提出一种用于分类问题的基于二阶段迭代的非负矩阵分解模型(2-stage iterative nonnegative matrix factorization model,2-STGINMF),在阶段1,基于训练样本之间的关系和标签信息,用非负矩阵分解技术学习训练样本的置信度分布矩阵。在阶段2,根据训练样本的置信度分布矩阵,基于训练样本和测试样本之间的关系以及测试样本内部的关系,学习测试样本关于不同类别的置信度分布矩阵。此外,提出了一种迭代式训练机制解决标签稀疏性的问题。实验结果表明,与当前的一些机器学习方法和矩阵分解方法相比,本文提出的2-STGINMF模型在不同类型的数据分类问题上都达到了最优的性能且在训练样本较少时也能获得较好的分类结果。
- 全聪李晨亮吴黎兵
- 关键词:非负矩阵分解
- 一种评论驱动的深度序列推荐方法
- 本发明公开了一种评论驱动的深度序列推荐方法,包括以下步骤:对用户评论文本建立词汇表,每个单词赋予随机初始化的词向量;为每篇文档构建文档词向量表达矩阵;得到方面感知的文档表达张量和多个特征图;计算用户的长期偏好向量和商品的...
- 李晨亮牛锡钏陈震中
- 基于多种提及关系的社交媒体用户位置推断被引量:1
- 2020年
- 针对现有基于生成文本和社交关系的联合位置推断方法对社交媒体中异质数据间的位置关联性挖掘不充分的问题,提出了一种基于多种提及关系的社交媒体用户位置推断方法。首先,综合考虑社交媒体文本中用户之间的提及关系、用户对位置指示词的提及关系和用户对地理名词的提及关系,构建包含用户、位置指示词和地理名词3种节点的异质网络;其次,基于共同提及关系提出用户−词语−位置简化算法来构建用户−位置异质网络,将位置邻近的用户更为紧密地联系起来;再次,提出有偏的随机游走算法对图中节点采样以充分探索网络结构,缓解已知位置的稀疏性问题;最后,采用基于多层感知机的神经网络分类器对用户进行位置推断。在GEOTEXT、TW-US和TW-WORLD这3个代表性Twitter数据集上的实验结果表明,所提方法可显著提高用户位置推断准确率。
- 乔亚琼罗向阳马江涛李晨亮李晨亮李瑞祥
- 关键词:社交媒体异质网络
- 基于文本注意力的推荐系统可解释性研究
- 2021年
- 可解释性能够提高用户对推荐系统的信任度并且提升推荐系统的说服力和透明性,因此有许多工作都致力于实现推荐系统的可解释性。由于评论中包含了丰富的信息,能够体现用户偏好与情感信息,同时包含了对应商品所具有的特性,最近的一些基于评论的深度推荐系统有效地提高了推荐系统的可解释性。这些基于评论的深度推荐系统中内置的注意力机制能够从对应的评论中识别出有用的语义单元(例如词、属性或者评论),而推荐系统通过这些高权重的语义单元做出决策,从而增强推荐系统的可解释性。但可解释性在很多工作中仅作为一个辅助性的子任务,只在一些案例研究中来做出一些定性的比较,来说明推荐系统是具有可解释性的,到目前为止并没有一个能够综合地评估基于评论推荐系统可解释性的方法。本文首先根据在注意力权重计算机制的不同,将这些具有可解释性的基于评论的推荐系统分为三类:基于注意力的推荐系统,基于交互的推荐系统,基于属性的推荐系统,随后选取了五个最先进的基于评论的深度推荐系统,通过推荐系统内置的注意力机制获得的评论权重文档,在三个真实数据集上进行了人工标注,分别量化地评价推荐系统的可解释性。标注的结果表明不同的基于评论的深度推荐系统的可解释性是具有优劣之分的,但当前的基于评论的深度推荐系统都有超过一半的可能性能够捕捉到用户对目标评论的偏好信息。在评估的五个推荐系统中,并没有哪个推荐系统在所有的数据中具有绝对的优势。也就是说,这些推荐系统在推荐可解释性方面是相互补充的。通过进一步的数据分析发现,如果推荐系统具有更精确的分数预测结果,那推荐系统通过注意力机制获得的高权重的信息确实更能够体现用户的偏好或者商品特征,说明推荐系统内置的注意力�
- 朱芮刘布楼刘艺语邹鑫雨李晨亮
- 关键词:推荐系统可解释性
- 一种用于条件文本生成的深度学习模型的构建方法以及条件文本的生成方法
- 本发明公开了一种用于条件文本生成的深度学习模型的构建方法以及条件文本的生成方法,首先设置用于文本生成的全局模型GlobVAE模型;然后给定无标注数据集,对GlobVAE模型进行训练,获得训练好的GlobVAE模型;接着设...
- 李晨亮段誉
- 文献传递
- 一种基于类别相关单词的短文本过滤与分类方法
- 本发明公开了一种基于类别相关单词的短文本过滤与分类方法,将传统主题模型的主题根据功能分成“类别主题”和“普通主题”;构造伪文本集,并以伪文本集作为模型的训练集对SSCF进行训练。训练结束后计算两类主题各自的词分布,并根据...
- 李晨亮张芷芊陈诗倩
- 文献传递