吴林
- 作品数:21 被引量:10H指数:2
- 供职机构:中国传媒大学更多>>
- 相关领域:自动化与计算机技术文化科学理学电子电信更多>>
- 一种多语言长文本相似性检索与分类工具
- 本发明提供一种多语言长文本相似性检索与分类工具,属于自然语言处理技术领域,具体包括:文本获取模块,文本预处理模块,文本分类预测模块,文本分类结果输出模块;文本获取模块负责对多个不同语言的长文本进行获取;文本预处理模块负责...
- 吴林周亭吴治伟王士奇李伟
- 一种多语言融媒体文本情感分析方法
- 本发明提供一种多语言融媒体文本情感分析方法,属于数据处理技术领域,具体包括:将所述源域语言矢量向量作为输入得到源语言编码器的输出,并通过语言鉴别器确定所述目标语言编码器的输出和源语言编码器的输出的差异,采用学习模块和双线...
- 吴林王永滨周亭李海滨李瑞刘嘉暄
- 一种基于内容挖掘的视频分类方法
- 本发明提供一种基于内容挖掘的视频分类方法,包括:S1、将待分类视频进行剪辑、按帧截图操作,生成截图集;S2、根据目标检测模型生成实体、实体类型、实体数量、实体位置、相关实体位置信息;S3、根据目标追踪模型,获取截图集中长...
- 李樱曹杰王永滨吴林胡滔
- 文献传递
- 一种多语言混合的新闻价值排序方法
- 本发明提供一种多语言混合的新闻价值排序方法,属于信息处理技术领域,具体包括:将多语言混合的新闻文本转换为固定语言的新闻文本内容,基于文本内容真实性评估算法得到所述新闻的真实性评估数据;基于新闻主体可信度评估算法得到所述新...
- 吴林周亭吴治伟王士奇李伟蓝星
- 一种基于内容挖掘的视频分类方法
- 本发明提供一种基于内容挖掘的视频分类方法,包括:S1、将待分类视频进行剪辑、按帧截图操作,生成截图集;S2、根据目标检测模型生成实体、实体类型、实体数量、实体位置、相关实体位置信息;S3、根据目标追踪模型,获取截图集中长...
- 李樱曹杰王永滨吴林胡滔
- 一种多语言混合的新闻价值排序方法
- 本发明提供一种多语言混合的新闻价值排序方法,属于信息处理技术领域,具体包括:将多语言混合的新闻文本转换为固定语言的新闻文本内容,基于文本内容真实性评估算法得到所述新闻的真实性评估数据;基于新闻主体可信度评估算法得到所述新...
- 吴林周亭吴治伟王士奇李伟蓝星
- 基于文本加权词共现的跨语言文本相似度分析被引量:2
- 2020年
- 跨语言文本相似度计算在跨语言信息检索、数据挖掘、抄袭检测等领域有着重要应用,但是跨语言文本相似度计算因为不同语言文法、结构等问题,在空间映射、特征选择上与单语言文本相似度计算有很大差异。为解决上述问题,采用一种基于文本加权词共现关系的跨语言文本相似度计算方法,通过平行语料库构建跨语言词共现关系模型,使用该模型进行跨语言文本映射,对不同语言的文本进行相似度计算。该模型实际反映了某种语言中某些关键词共同出现时映射成另一种语言时的关键词概率分布。实验表明,该方法对跨语言文本排序的计算更接近人工评判标准。
- 张晓宇王永滨吴林
- 关键词:词共现文本相似度跨语言统计翻译模型
- 一种多语言新闻主题词的分词方法
- 本发明提供一种多语言新闻主题词的分词方法,属于数据挖掘技术领域,具体包括:基于新闻的发布时间、题目中的关键词、分类确定待提取文本的临近领域,构建模型的源域模块,采集待提取文本的所述临近领域的有标签数据,构建源域数据集,构...
- 周亭吴林王永滨范伟健彭奕豪王志杰
- 基于领域自适应的无监督文本关键词提取模型——以“人工智能风险”领域文本为例被引量:6
- 2022年
- [目的/意义]针对专业领域研究人员难以从大量无监督文本数据中快速获取领域关键知识,以精准把握专业研究方向和内容。[方法/过程]文章提出一种基于迁移学习领域自适应的文本关键词提取模型。首先通过采集中国知网中特定领域的文章和关键词,将其作为目标域数据,将待提取关键词的无监督文本作为源域数据,通过最小化二者间的共享相似特征和关键词分类交叉熵,实现关键词提取方法的跨领域迁移,完成对无监督领域文本的关键词提取任务。[结果/结论]对1313篇“人工智能风险”主题的文章进行领域关键词提取,实验表明该领域关键词提取模型相比于BiLSTM-CRF、TF-IDF模型提取效果提升显著,在领域关键知识提取场景中有较强应用价值。
- 毛立琦石拓吴林马涛
- 关键词:领域自适应
- 一种基于混合算法的江南小调计算机辅助作曲的方法
- 本发明公开了一种基于混合算法的江南小调计算机辅助作曲的方法,具体步骤包括建立江南小调音乐素材库、建立江南小调作曲知识规则库、制定遗传算法的关键规则、提取遗传算法的初始种群和生成江南小调旋律,建立94首的江南小调音乐素材库...
- 王鑫王永滨吕志胜李樱吴林
- 文献传递