蒋玉茹
- 作品数:43 被引量:121H指数:5
- 供职机构:北京信息科技大学更多>>
- 发文基金:国家自然科学基金北京市教委科技计划面上项目北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学交通运输工程机械工程更多>>
- 一种领域评审专家行为轨迹的知识图谱构建方法
- 本发明提供一种领域评审专家行为轨迹的知识图谱构建方法,采用自顶向下与自底向上相结合的方法完成构建。通过爬虫进行数据采集并预处理;定义领域本体,建立模式结构;利用自然语言处理技术进行知识抽取;针对同名专家的多类属性特征,提...
- 张仰森黄改娟蒋玉茹尤建清张良李尚美
- 文献传递
- 边云协同计算管理方法、装置、电子设备及存储介质
- 本公开提供了一种边云协同计算管理方法,其包括:根据每类任务的总数据大小、每类任务的总CPU周期、平均传输速率、CPU电压和CPU频率决策获得下一第一时间尺度内的CPU电压和CPU频率对;以及根据时隙t内的所有任务的数据大...
- 侯守璐王涛蒋玉茹刘秀磊
- 多情景跨领域中文文本智能校对关键技术及应用
- 2021年
- 数字化时代,多种应用情景的电子文本大量涌现,包括各种编码输入法、OCR识别、机器翻译、语音识别等产生的文本,并在新闻和图书出版、各种公文处理、网络媒体处理等跨领域得到广泛应用。电子文本中经常会出现字词、句法、语义级的各种错误,直接影响文本的质量,敏感性、政治性错误还会影响社会安全和稳定。人工对文本内容的审核校对,成本高且质量得不到保证。开展多情景跨领域的中文文本智能校对技术研究,可以发现各种错误的出现机理,有利于规范文本内容,减轻劳动强度,降低出版成本,具有重要的科学、社会意义及应用价值。项目历时近20年,在国家自然科学基金等项目支持下,通过校企合作,对中文文本校对的关键技术进行深入研究并取得突破,形成多项创新性技术成果,部分成果在国内外实现了重大技术突破。
- 张仰森亓文法亓文法施水才吴云芳陈若愚黄改娟王洪俊吴云芳肖诗斌尤建清黄改娟张良
- 关键词:电子文本中文文本文本校对机器翻译公文处理国家自然科学基金
- 汉语无情对联生成及评价模型研究
- 张禹尧蒋玉茹吴雨粟静
- 基于广义话题理论的话题句识别被引量:13
- 2012年
- 汉语标点句句首话题缺失是机器翻译、信息抽取准确率不高的原因之一。该文从广义话题理论出发,根据汉语话题结构的特点,提出标点句的话题句识别研究方案,包括两个阶段性任务:单个标点句的话题句识别和序列标点句的话题句序列构建。识别出标点句的话题句也就找到了标点句句首缺失的话题。该文解决单个标点句的话题句识别任务,主要采用语义泛化和编辑距离两种手段。实验中开放测试的准确率比基线高出12.51个百分点。该结果说明,运用广义话题理论进行单个标点句的话题句识别可产生明显的效果。
- 蒋玉茹宋柔
- 社交媒体话题检测与追踪技术研究综述被引量:18
- 2019年
- 随着计算机的普及与互联网的高速发展,Facebook、Twitter、新浪微博等社交媒体逐渐成为人们信息交流的主要渠道。然而,由于社交媒体信息具有数量庞大、结构复杂、传播速度快等特点,人们无法从中快速准确地获取想要的信息。于是,话题检测与追踪技术应运而生,它将用户关注的信息从大量无序信息中筛选出来,经过细致的过滤和有效的整合,生成简单、清晰的话题信息,并在此基础上实现对话题的追踪和发展趋势分析。该文对社交媒体上的话题检测与追踪工作进行综述,首先论述了话题检测方面的三类方法,包括基于主题模型的话题检测、基于改进聚类算法的话题检测和基于多特征融合的话题检测;其次,对话题追踪的研究成果进行了介绍,主要分为非自适应话题追踪和自适应话题追踪两大类;最后,列举出社交媒体话题的检测与追踪中存在的问题以及对未来研究的展望。
- 张仰森段宇翔黄改娟黄改娟
- 关键词:聚类主题模型
- 一种面向文本分类的特征向量优化方法被引量:13
- 2017年
- 对文本进行建模的普遍方法是使用向量空间模型构建文本向量,并利用权值调整和维度调整对文本向量进行优化。提出了一种面向文本分类的特征向量优化方法。首先利用剔除近义词方法优化文本向量中的特征项;然后提出贡献率因子的概念,并利用其优化特征值。实验表明,相比朴素贝叶斯分类方法其效果提高了0.96%。因此,通过去除近义词和对提取出的特征词调整权重,可以达到优化特征向量、提高文本分类效果的目的。
- 郭正斌张仰森蒋玉茹
- 关键词:特征向量向量优化文本分类
- 微博用户关系网络中意见领袖的分析与挖掘被引量:4
- 2015年
- 在微博世界中,微博意见领袖对微博中舆论的导向发挥着重要的作用,因此,研究微博意见领袖的分析与挖掘方法十分必要。探讨了微博用户网络中意见领袖的分析与挖掘方法,构建了微博意见领袖的特征指标体系,采用层次分析法(Analytic Hierarchy Process,APH)给出了各特征指标的权重计算方法,从而提出了用户初始影响力的计算模型。在此基础上,借鉴PageRank算法思想,提出了用户初始影响力扩散的计算模型,实现了微博用户影响力的定量化度量,为意见领袖的分析确定提供了充分的依据。实验数据表明,所提出的微博意见领袖的分析与挖掘方法是非常有效的。
- 张仰森蒋玉茹陈若愚彭啟文
- 关键词:意见领袖
- 一种多特征融合的微博中社会安全事件检测方法
- 本发明公开了一种多特征融合的微博中社会安全事件检测方法,包括获取微博文本数据后对获取到的微博文本进行预处理、提取微博文本中的社会安全事件特征词、基于语境的词语语义相关度计算方法计算社会安全事件特征词的相关度、构建社会安全...
- 张仰森黄改娟蒋玉茹尤建清陈若愚
- MCA-Reader:基于多重联结机制的注意力阅读理解模型被引量:4
- 2019年
- 机器阅读理解是当下自然语言处理的一个热门任务,其内容是:在给定文本的基础上,提出问题,机器要在给定文本中寻找并给出最终问题的答案。片段抽取式阅读理解是当前机器阅读理解研究的一个典型的方向,机器通过预测答案在文章中的起始和结束位置来定位答案。在此过程中,注意力机制起着不可或缺的作用。该文为了更好地解决片段抽取式机器阅读理解任务,提出了一种基于多重联结机制的注意力阅读理解模型。该模型通过多重联结的方式,更有效地发挥了注意力机制在片段抽取式机器阅读理解任务中的作用。利用该模型,在第二届“讯飞杯”中文机器阅读理解评测(CMRC2018)的最终测试集上EM值为71.175,F1值为88.090,排名第二。
- 张禹尧蒋玉茹毛腾张仰森