高盛祥 作品数:277 被引量:227 H指数:8 供职机构: 昆明理工大学 更多>> 发文基金: 国家自然科学基金 云南省自然科学基金 南省应用基础研究计划重点项目 更多>> 相关领域: 自动化与计算机技术 语言文字 文化科学 电子电信 更多>>
基于词性软模板注意力机制的短文本自动摘要方法 被引量:3 2020年 在短文本摘要任务中,带有直观主谓宾结构的摘要句语义完整性较强,但词性组合对该结构具有约束作用.为此文中提出基于词性软模板注意力机制的短文本自动摘要方法.首先对文本进行词性标记,将标记的词性序列视为文本的词性软模板,指导方法构造摘要句的结构规范,在编码端实现词性软模板的表征.再引入词性软模板注意力机制,增强对文中核心词性(如名词、动词等)的关注.最后在解码端联合词性软模板注意力与传统注意力,产生摘要句.在短文本摘要数据集上的实验验证文中方法的有效性. 张亚飞 左一溪 余正涛 郭军军 高盛祥关键词:文本摘要 自然语言生成 基于案件要素指导的涉案舆情新闻文本摘要方法 涉案舆情新闻文本摘要任务是从涉及特定案件的舆情新闻文本中,获取重要信息作为其简短摘要,因此对于相关人员快速掌控舆情态势有着重要的作用.涉案舆情新闻文本摘要相比开放域文本摘要任务,通常涉及特定的案件要素,这些要素对摘要生成... 韩鹏宇 高盛祥 余正涛 黄于欣 郭军军基于依存图网络的汉越神经机器翻译方法 本发明涉及基于依存图网络的汉越神经机器翻译方法,属于自然语言处理技术领域。本发明首先从网站爬取汉越平行语料,将获取的汉越双语语料分别利用依存句法解析工具进行依存句法解析。其次将获取的源语言依存句法解析树利用图编码器转化为... 余正涛 杨威亚 高盛祥 文永华 朱俊国 吴霖文献传递 基于多路信息聚合协同解码的单通道语音增强 2024年 为了改善基于卷积编解码架构的单通道语音增强网络对语音声学特征提取不充分、解码特征丢失严重的问题,提出一种基于多路信息聚合协同解码的单通道语音增强网络MIACD,通过双路编码器充分提取融入了语音自监督学习(SSL)表征的幅度谱和复数谱特征,由4层Conformer分别从时间和频率维度对提取特征建模,采用残差连接将双路编码器提取的语音幅度、复数特征引入三路信息聚合解码器,并利用所提通道-时频注意力(CTF-Attention)机制根据语音能量分布情况调节解码器中聚合信息,有效缓解解码时可用声学信息缺失严重的问题。在公开数据集Voice Bank DEMAND上的实验结果表明,与用于单通道语音增强的协作学习框架(GaGNet)相比,MIACD在客观评价指标宽带感知评估语音质量(WB-PESQ)上提升了5.1%,短时客观可懂度(STOI)达到96.7%,验证所提方法可充分利用语音信息重构信号,有效抑制噪声并提升语音可理解性。 莫尚斌 王文君 王文君 高盛祥 高盛祥关键词:声学特征 融合句法结构及Tree-LSTM的汉越平行句对抽取方法 本发明涉及融合句法结构及Tree‑LSTM的汉越平行句对抽取方法。本发明首先预训练汉越双语词向量,将汉越双语映射到同一语义空间中,考虑汉越句子结构具有差异性,通过依存句法树将句子序列结构转化为依存树结构,通过Tree‑L... 高盛祥 张迎晨 余正涛 朱浩东文献传递 特征规范化的图卷积神经网络推荐算法 被引量:1 2023年 为了提高推荐算法的推荐性能,针对现有的图卷积神经网络(graph convolutional neural network,GCN)的推荐算法中,2-3层的传播网络结构不利于较远距离节点之间进行信息交互,而加深网络层数又会导致性能急剧下降的问题,提出一种特征规范化的图卷积神经网络推荐算法。该方法为传播网络中每一层输出特征进行规范化处理,避免节点嵌入表示随着网络层数增加而变得过于相似;在预测阶段,使用自注意力机制(self-attention mechanism,SA)将各层的输出进行连接,以获得更好的节点最终表示。在3个真实数据集上与传统算法以及现有同类型推荐算法进行对比,验证了该模型的有效性。实验结果表明,所提模型与基准模型相比,在召回率Recall@N和归一化折损累计增益NDCG@N上有明显提高,平均提升1.675%,最高可提升3.406%。 赵东琛 车文刚 高盛祥基于Listwise的深度学习专家排序方法 被引量:7 2015年 针对传统专家列表排序方法易陷入局部最小和训练时间过长、不能较好逼近排序函数的问题,结合深度神经网络与Listwise的专家排序方法,提出基于Listwise的深度学习专家排序方法.该方法首先提出深度学习专家排序模型,通过无监督的自训练得到较优参数逐层初始化权重.再将查询对应的专家文档形成的训练实例输入到受限玻尔兹曼机中进行训练,通过余弦值取代矩阵相减计算权重,完成权重整体更新,构建深度学习专家排序模型.对比实验表明文中方法具有较好效果,引入深度学习能有效提升排序精度. 李贤慧 余正涛 魏斯超 高盛祥 王立人基于时空注意力机制的视频引导机器翻译方法 2024年 视频引导机器翻译是一种多模态机器翻译任务,其目标是通过视频和文本的结合产生高质量的文本翻译。但是之前的工作只基于视频中的时间结构选择相关片段引导机器翻译,所选片段中存在大量与目标语言无关的信息。因此,在翻译过程中,视频中的时空结构没有得到充分利用,从而无法有效缓解机器翻译中细节缺失或翻译错误的问题。为了解决这一问题,该文提出了一种基于时空注意力(Spatial-Temporal Attention,STA)的模型来充分利用视频中的时空信息引导机器翻译。该文提出的注意力模型不但能够选择与目标语言最相关的时空片段,而且能进一步聚焦片段中最相关的实体信息。所关注的实体信息能有效增强源语言和目标语言的语义对齐,从而使得源语言中的细节信息得到准确翻译。该文的方法基于Vatex公共数据集和构建的汉-越低资源数据集进行实验,在Vatex与汉-越低资源数据集上BLEU4分别达到32.66和18.46,相比于时间注意力基线方法提高了3.54与0.89个BLEU值。 姜舟 余正涛 高盛祥 毛存礼 郭军军融合主题信息的篇章级神经机器翻译方法 本发明涉及融合主题信息的篇章级神经机器翻译方法,属自然语言处理领域。先对篇章级平行语料进行预处理并进行BPE分词;再利用词嵌入主题模型训练源语言篇章主题,对篇章文本进行向量化表征,得到文本中每个单词的词嵌入,后在神经机器... 余正涛 陈玺文 高盛祥融入词集合信息的跨境民族文化实体识别方法 被引量:2 2022年 跨境民族文化领域实体通常由描述民族文化特征的领域词汇组合构成,使用当前主流的基于字符表征的实体识别方法会面临领域实体边界模糊问题,造成实体识别错误。为此,该文提出一种融入词集合信息的跨境民族文化实体识别方法,利用领域词典获取的词集合增强领域实体的词边界和词语义信息。首先,构建跨境民族文化领域词典,用于获取词集合信息;其次,通过词集合注意力机制获取词集合向量之间的权重,并融入位置编码增强词集合位置信息;最后,在特征提取层融入词集合信息,增强领域实体边界信息并缓解仅使用字符特征表示所带来的词语义缺失问题。实验结果表明,在跨境民族文化文本数据集上所提出方法相比于基线方法的F_(1)值提升了2.71%。 杨振平 毛存礼 雷雄丽 高盛祥 陆杉 张勇丙关键词:领域词典