您的位置: 专家智库 > >

李健

作品数:13 被引量:11H指数:2
供职机构:中国人民解放军信息工程大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术天文地球文化科学更多>>

文献类型

  • 10篇期刊文章
  • 2篇会议论文

领域

  • 9篇自动化与计算...
  • 3篇天文地球
  • 1篇文化科学

主题

  • 3篇爬虫
  • 2篇网络
  • 2篇网络爬虫
  • 2篇抽取
  • 1篇短基线
  • 1篇多事件
  • 1篇新闻
  • 1篇新闻分析
  • 1篇信息化测绘
  • 1篇异步
  • 1篇异步加载
  • 1篇语言描述
  • 1篇载波
  • 1篇增量式
  • 1篇整周模糊度
  • 1篇生成器
  • 1篇实时数据
  • 1篇实时数据流
  • 1篇识别方法
  • 1篇事件抽取

机构

  • 12篇中国人民解放...

作者

  • 12篇李健
  • 1篇赵冬青
  • 1篇刘长建
  • 1篇张超然
  • 1篇刘海砚
  • 1篇张西光
  • 1篇吕志平
  • 1篇周会娟
  • 1篇丁清光
  • 1篇李峰

传媒

  • 3篇现代计算机
  • 1篇计算机工程与...
  • 1篇计算机仿真
  • 1篇测绘工程
  • 1篇计算机与现代...
  • 1篇信息工程大学...
  • 1篇电脑知识与技...
  • 1篇科技传播
  • 1篇2007年“...
  • 1篇2008年(...

年份

  • 1篇2023
  • 3篇2022
  • 4篇2021
  • 1篇2016
  • 1篇2014
  • 1篇2008
  • 1篇2007
13 条 记 录,以下是 1-10
排序方式:
网络爬虫实时控制器的设计与实现被引量:1
2021年
针对个性化数据采集,提出一个轻量级网络爬虫框架,该框架包括控制器、下载器、解析器、线程池和代理池等组件。在此框架下,设计一个具有实时处理能力的爬虫控制器,能够自动保存和恢复任务场景。详细介绍爬虫控制器的工作原理和C#实现,并将其应用于站内文章采集。实验结果表明:所提出的爬虫框架是高效易用的,控制器的实时处理能力在实际爬虫开发中非常重要。
李健张克亮
关键词:网络爬虫C#
基于实时数据流的CORS数据库设计
基于连续运行参考站系统(Continuously Operating Reference System,CORS)的体系结构,本文讨论了基于实时数据流的CORS的数据库设计.相对基于文件的CORS数据的传输与管理,这便于...
丁清光李健
关键词:大地测量学参考站系统实时数据流数据库设计数据传输
文献传递
载波相位约束整周模糊度在短基线RTK中的应用被引量:1
2016年
针对单历元RTK定位中受到卫星升起、周跳频发等外界条件干扰时,整周模糊度长时间不能固定,严重影响RTK定位实时精度的问题。文中提出一种用载波相位约束整周模糊度的方法来提高模糊度固定率、Ratio值和解算精度,并且结合GPS单系统、GPS/GLONASS双系统两组实测数据进行未加入和加入载波相位约束整周模糊度的比较实验。结果表明该方法可行。
李峰张建军李健刘长建程志强
关键词:RTK短基线GPS/GLONASS
基于Gecko浏览器内核的谷歌翻译爬虫
2021年
异步加载技术在Web中广泛使用,这给网络爬虫开发带来一些困难。本文提出一种基于Gecko浏览器内核的异步数据采集方法。此方法模拟浏览器加载网页,完成用户输入,触发执行脚本,最终获得目标数据。应用上述方法,设计并实现了面向谷歌翻译的专用爬虫,能够批量生成双语平行语料,并采用轮询检测机制进一步提高爬虫效率。实验结果表明:本文所提出的解决方案是行之有效的,如何模拟用户操作是实现爬虫的基础,如何检测目标数据是提高效率的关键。
李健
关键词:网络爬虫异步加载
一种基于Power Query和透视表的数据处理方法
2021年
“大数据”已成为当今炙手可热的术语,“大数据”的应用服务着人们生活工作的方方面面。如何进行大数据处理、大数据分析提高办公效率是当前学生任职后必备的一项基本素质,该文以战略支援部队信息工程大学洛阳校区在资产统计过程中遇到的数据处理问题为牵引,提出一种基于Power Query和数据透视表的数据处理方法,分析解决问题的思路、讨论解决问题的办法,培养学生解决复杂数据问题的思维方式,进而实现高效处理数据。
沈丽民李健
关键词:数据处理数据透视表
基于傅里叶变换的碎片拼接复原技术被引量:1
2014年
随着大数据时代的来临,碎片拼接技术的重要性愈加突出,诸如破碎文件的拼接在司法物证复原、历史文献修复,文字图片数据的意外破损、商业机密的获取等多个环节离不开碎片拼接复原技术。本文用傅里叶变换来分析碎片图像之间的相关性,提出了一种新型简便碎片复原技术。
朱兆梁马朝翰李健张超然
关键词:傅里叶变换
面向信息化测绘的大地测量数据接口与数据标准
建立了由接12文件、接口文件处理器和共享信息模型组成的大地测量数据接口体系结构,划分了大地测量数据服务的3类不同接口类型。讨论了大地测量技术基础标准、信息系统标准和数据服务标准的内容框架,建立了大地测量数据标准体系的层次...
吕志平张西光赵冬青李健
关键词:信息化测绘数据接口
文献传递
基于深度学习的篇章级事件抽取研究综述被引量:2
2022年
事件抽取是信息抽取领域中一项十分重要且具有挑战性的任务,在事理图谱构建、舆情监控、态势感知等方面起着举足轻重的作用。目前研究较多的是句子级事件抽取,而面对“论元分散”和“多事件”的挑战,基于深度学习的篇章级事件抽取陆续展开。总结了篇章级事件抽取的定义、主要任务和面临的挑战,分别从获取词语、句子和文档三种不同粒度的语义信息,捕获文档结构特征建模不同的图结构,融合语义信息和结构特征,以及将事件抽取转化为阅读理解、智能问答等其他任务解决方案等四个不同的维度,详细讨论了近年来篇章级事件抽取相关的模型和方法,在此基础上归纳了常用数据集,并对典型方法的抽取效果进行了评估和对比。展望了篇章级事件抽取的研究趋势。
胡瑞娟周会娟刘海砚李健
关键词:多事件评价指标
基于深度学习的轻量级自然语言描述生成算法
2022年
为了提升轻量级自然语言描述生成效果与效率,以视频图像作为研究对象,提出基于深度学习的轻量级自然语言描述生成算法,分析自然语言生成后能否对视频图像内容作出充分解读。采用深度迁移学习算法提取视频图像中的语义特征与帧流语义特征,建立多特征融合的轻量级自然语言描述生成模型,对所提取的图像语义特征与帧流语义特征实施融合后,导入视频自然语言描述模型,生成自然语言描述。实验结果表明,所提算法不受视频图像类型、数量的约束,在不同条件下所生成的视频图像轻量级自然语言描述均符合视频图像内容,且对视频图像特征的提取、融合效果较好,可为轻量级自然语言描述生成工作提供有效协助。
李健马延周胡瑞娟
关键词:轻量级自然语言特征提取
面向中文命名实体识别任务的数据增强被引量:3
2022年
在低资源自然语言处理(NLP)任务中,现有的数据不足以训练一个理想的深度学习模型,文本数据增强是提高此类任务训练效果的有效方法。针对中文命名实体识别任务,提出一组基于实例替换的数据增强方法。将训练样本中的命名实体替换为另一个同类实体而保持标签不变,具体算法包括:1)实体之间交叉互换;2)实体内部同义替换;3)中文人名自动生成。分别在PeopleDailyNER和CLUENER2020数据集上应用上述方法,并对BERT+CRF模型进行增强训练。实验结果表明,仅添加与原始数据等量的增强数据,在小样本条件下能使模型F1值在2个数据集上分别提升约10%和7%,随着样本数据的增加,训练效果仍有明显提升。
李健张克亮唐亮夏榕璟任静静
关键词:命名实体识别
共2页<12>
聚类工具0