您的位置: 专家智库 > >

孙栩

作品数:14 被引量:1H指数:1
供职机构:北京大学更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 13篇专利
  • 1篇学位论文

领域

  • 4篇自动化与计算...
  • 4篇文化科学

主题

  • 8篇网络
  • 6篇神经网
  • 6篇神经网络
  • 6篇文本
  • 5篇向量
  • 4篇神经网络模型
  • 4篇网络模型
  • 4篇基于语义
  • 4篇标签
  • 3篇隐层
  • 3篇相关度
  • 3篇分词
  • 3篇分词方法
  • 2篇新闻
  • 2篇新闻源
  • 2篇循环神经网络
  • 2篇语料
  • 2篇语义单元
  • 2篇语义相关
  • 2篇语义相关度

机构

  • 14篇北京大学

作者

  • 14篇孙栩
  • 3篇李炜
  • 2篇苏祺
  • 2篇杨洋
  • 2篇张艺

年份

  • 1篇2021
  • 3篇2020
  • 2篇2019
  • 4篇2018
  • 3篇2017
  • 1篇2007
14 条 记 录,以下是 1-10
排序方式:
基于机器学习的汉语缩略语识别与预测
缩略语处理是自然语言处理的一个重要任务,具有较强实际应用价值。本文探讨汉语缩略语处理的两个重要方面:基于文档的缩略语自动识别,及基于全称的缩略语自动预测。 对于缩略语自动识别,本文将独立于全称的缩略语识别问题形...
孙栩
关键词:词聚类自然语言处理支持向量机模型
一种可扩展的基于神经网络的序列标注方法
本发明公开了一种可扩展的基于神经网络的序列标注方法。本方法为:创建一层叠n阶模型,该层叠n阶模型的训练过程为:首先根据训练语料中各标注单元的标签生成多个标签集合,包括一阶至n阶n个标签集合;标注单元i的标签与其邻近n‑1...
孙栩张艺杨洋
一种基于领域适应性的网络文本的分词方法
本发明公布了一种基于领域适应性的社交网络文本的分词方法,通过建立集成式神经网络和采用自训练的学习方法,利用跨领域的新闻语料、社交网络中的标注数据和无标注数据对集成式神经网络模型进行训练;具体将社交网络文本分为标注和未标注...
孙栩许晶晶马树铭
文献传递
基于词向量查询模型的文本简化方法
本发明公布了一种基于词向量查询模型的文本简化方法,基于序列到序列模型,在解码时参照注意力机制得到解码器的隐状态和所有词汇的词向量的相关度,作为下一步待生成的词语的可能性的度量;包括:设计文本编码器,对原文本进行压缩;设计...
孙栩马树铭李炜
文献传递
基于语义单元信息的文本多标签分类方法
本发明公布了一种基于语义单元信息的文本多标签分类方法,建立语义单元多标签分类模型SU4MLC,将基于注意力机制的循环神经网络序列到序列模型作为基线模型进行改进,通过改进源端用于注意力机制的表示;利用深度学习中的空洞卷积对...
林俊旸苏祺孙栩
一种基于语义相关度模型的中文文本摘要获取方法
本发明公布了一种基于语义相关度模型的中文文本摘要获取方法,设计文本编码器利用深度神经网络将原文本进行压缩,得到原文本的编码向量;设计摘要解码生成器生成摘要的解码向量;再通过构建语义相关度模型,得到原文本的编码向量和摘要的...
孙栩马树铭许晶晶
文献传递
一种神经网络模型的稀疏化后向传播训练方法
本发明公布了一种神经网络模型的稀疏化后向传播训练方法,在后向传播过程中,通过基于K大值的稀疏化处理,减少更新与实例相关度低的信息,提高深度神经网络的训练速度和训练效果;在后向传播过程中,首先对输出梯度<Image fil...
孙栩任宣丞马树铭
文献传递
一种基于领域适应性的网络文本的分词方法
本发明公布了一种基于领域适应性的社交网络文本的分词方法,通过建立集成式神经网络和采用自训练的学习方法,利用跨领域的新闻语料、社交网络中的标注数据和无标注数据对集成式神经网络模型进行训练;具体将社交网络文本分为标注和未标注...
孙栩许晶晶马树铭
一种基于迁移学习的低资源领域分词器训练方法及分词方法
本发明公开了一种基于迁移学习的低资源领域分词器训练方法及分词方法。本方法为:1)在目标领域和各设定领域分别训练生成对应的分词器;2)利用各领域的分词器对目标领域的语料分词处理,获得各分词器在该目标领域的语料上每个字x<S...
孙栩许晶晶李炜马树铭
文献传递
一种基于稀疏化后向传播训练的神经网络模型压缩方法
本发明公布了一种神经网络模型的稀疏化后向传播压缩方法,属于信息技术领域,涉及机器学习和深度学习技术。在后向传播过程中,神经网络模型的每层利用上一层的输出梯度作为输入计算梯度,进行k大值稀疏化处理,得到稀疏化处理后的向量和...
孙栩任宣丞马树铭位冰镇
文献传递
共2页<12>
聚类工具0