贺瑞芳
- 作品数:65 被引量:103H指数:5
- 供职机构:天津大学更多>>
- 发文基金:国家自然科学基金天津市自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信理学更多>>
- 融合社交上下文与多粒度关系的无监督社交媒体摘要方法
- 本发明公开一种融合社交上下文与多粒度关系的无监督社交媒体摘要方法,包括以下步骤:(1)构建帖子级别社交关系网络,提取帖子文本内容特征,并使用图卷积网络聚合帖子的社交上下文信息;(2)帖子‑帖子级别的社交关系与帖子‑单词级...
- 贺瑞芳刘焕宇王浩成
- 基于条件随机域的中文事件类型识别被引量:8
- 2012年
- 传统的分步骤事件抽取方法中,事件元素识别的结果无法指导事件类型识别,而事件类型识别的效果在很大程度上决定了事件抽取系统的整体性能.文中为解决事件类型识别对元素识别的后向依赖问题,将事件抽取看作序列标注,构建一个改进的条件随机域联合标注模型,将事件类型和事件元素在图模型中同时进行标注.同时,通过触发词嵌入试图解决事件抽取中的数据不平衡问题.ACE2005中文语料上的实验表明,基于该模型的方法提高了事件类型识别的性能,最终F值达到63.53%.
- 胡博磊贺瑞芳孙宏王文俊
- 关键词:事件抽取条件随机域
- 基于知识增强的注意力神经网络的隐式篇章关系识别方法
- 本发明公开一种基于知识增强的注意力神经网络的隐式篇章关系识别方法,包括如下步骤:1)构建基本论元表示层;2)构建外部知识表示层;3)构建知识增强的论元间交互注意力机制,目的是将外部知识作为关系向量与带有论元交互信息的矩阵...
- 贺瑞芳郭凤羽王建党建武贺迎春朱永凯
- 文献传递
- 面向话题的多微博时序文摘方法
- 本发明公开一种面向话题的多微博时序文摘方法,包括如下步骤:1)以时间点为横轴、相应时间点对应的微博更新速度为纵轴,进行面向话题的微博文本流热度信号建模;2)采用小波降噪对步骤1)的初始信号降噪,按一定时间粒度,选取其中的...
- 贺瑞芳于广川党建武胡清华
- 一种基于连续化关系扩散和多粒度文本的微博话题检测方法
- 本发明公开了一种基于连续化关系扩散和多粒度文本的微博话题检测方法,包括如下步骤:(1)构建用户级对话网络;(2)采用图扩散技术获取连续化关系表示:采用图扩散技术传递节点信息,所得的信息分布代表了从起始节点到其他节点的亲密...
- 贺瑞芳吴辰昊朱永凯
- 基于宏微观重要性判别模型的时序多文档文摘被引量:4
- 2009年
- 时序多文档文摘是针对新闻领域跨时段的相关文档集,即系列新闻报道进行问题无关的、抽取式文摘.根据系列新闻报道不同细节层次的时序特性,提出一种基于宏微观重要性判别模型的内容选择方法.从宏观和微观角度挖掘信息随着时间进化的时序特性,以指导时序多文档文摘的内容选择.首先通过宏观模型确定重要的时间点,然后通过微观模型在重要的时间点选择重要的句子,从而更有效地获取文摘.实验证明该方法是有效的.
- 贺瑞芳秦兵刘挺潘越群李生
- 基于多粒度生成图像增强表示的隐式篇章关系识别方法
- 本发明公开一种基于多粒度生成图像增强表示的隐式篇章关系识别方法,由于文本本身存在多义性、模糊性等问题,我们首次对联想策略进行了仿真,提出了一种多粒度生成的图像并用于增强论元向量表示的神经网络。具体来说,我们根据文本的不同...
- 贺瑞芳王建贺迎春郭凤羽朱永凯
- 文献传递
- 基于分层潜在语义驱动网络的事件检测
- 2024年
- 事件检测旨在检测句子中的触发词并将其分类为预定义的事件类型.如何有效地表示触发词是实现该任务的核心要素.目前基于表示的方法通过复杂的深度神经网络来学习候选触发词的语义表示,以提升模型性能.然而,其忽略了2个问题:1)受句子语境的影响,同一个触发词会触发不同的事件类型;2)受自然语言表达多样性的影响,不同的触发词会触发同一个事件类型.受变分自编码器中隐变量及其他自然语言处理(natural language processing,NLP)任务中分层结构的启发,提出基于分层潜在语义驱动网络(hierarchical latent semantic-driven network,HLSD)的事件检测方法,通过句子和单词的潜在语义信息来辅助缓解以上2个问题.模型从文本表示空间中分层降维到新的潜在语义空间,探索事件宏微观语境中更本质的影响信息.首先,通过BERT对候选句子进行编码,得到句子的表示和句子中单词的表示;其次,设计一个双重的潜在语义机制,并采用VAE挖掘句子和单词级潜在语义;最后,从不同粒度的上下文角度,提出采用一个由粗到细的分层结构来充分使用句子和单词的潜在信息,从而提升模型的性能.ACE2005英文语料库上的实验结果表明,所提方法的F1值在事件检测任务上达到了77.9%.此外,在实验部分对以上2个问题进行了定量分析,证明了所提方法的有效性.
- 肖梦南贺瑞芳马劲松
- 关键词:潜在语义分层结构
- 基于文本摘要及引用关系的可视辅助文献阅读被引量:4
- 2016年
- 近年来,科技论文发表数量与日俱增,科研人员需要阅读文献的数量也随之迅速增长.如何快速而有效地阅读一篇科技论文,逐渐成为一个重要的研究课题.另一方面,在阅读科技论文时,理解与其相关的重要参考文献可帮助读者更好地理解文章的内容.然而,如何从众多的参考文献中快速找到最重要、最相关的几篇,如何避免在阅读过程中迷失在文档的多维空间,仍是值得研究的问题.为了解决上述问题,提出了一个基于文本摘要和引用关系的可视辅助文献阅读系统.该系统利用一种基于阅读目的的文本摘要技术提取出论文中重要的句子,并采用多尺度的可视化方式进行展示;使用LDA(latent dirichlet allocation)话题模型抽取参考文献的核心话题;记录用户的阅读行为,用于提示其阅读上下文,以保证用户关注点不发生迷失.同时,在一个具体的案例场景中详细介绍了系统的使用方法,并进行了用户研究以验证系统的可用性.
- 张加万杨思琪李泽宇杨伟强王锦东贺瑞芳黄茂林
- 关键词:文本摘要引用网络
- 一种基于回复者个人特征增强的对话生成方法
- 本发明公开了一种基于回复者个人特征增强的对话生成方法,包括如下步骤:1)构建2个encoder‑decoder基本框架;2)利用vMF分布在encoder‑decoder模型上构建基于vMF分布的VAE模型作为个人特征提...
- 贺瑞芳王瑞芳常金鑫王龙标党建武
- 文献传递