刘洋 作品数:6 被引量:19 H指数:2 供职机构: 国家互联网应急中心 更多>> 发文基金: 国家自然科学基金 北京市自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 经济管理 更多>>
面向大规模图像拷贝检测的一种目标级签名提取方法 被引量:1 2016年 针对传统的不变量提取方法耗时巨大、对图像背景和前景目标不加取舍、特征冗余多而且区分性差的问题,提出一种目标级签名提取方法——BLIP.首先提出一种快速的仿射不变局部特征检测与描述方法,将提取速度由秒级提升到毫秒级;然后采用改进的二进制化赋范梯度算法检测图像中的前景目标,并将目标区域内BLIP的空间上下文编码为二进制图像签名.实验结果表明,BLIP方法对网络中常见的拷贝攻击具有良好的鲁棒性,提取时间仅需8.9 ms,消耗的内存分别为尺度不变特征变换算法的0.17%,二进制鲁棒尺度不变关键点算法的2%. 王刚 刘洋 高科 李锦涛关键词:拷贝检测 网络仿冒(Phishing)的防范 被引量:1 2006年 近年来,我国的网络欺诈也随着电子商务、网上结算、网上银行等业务在日常生活中的普及应用而层出不穷。网络仿冒的频频出现,使得涉及网上业务的金融机构和部分安全厂商越来越重视这个问题。CNCERT/CC自2004年以来一直致力于处理涉及我国主机的网络仿冒事件,截至2005年12月底共接到网络仿冒案件报告600余起,其中关于Ebay216起,得到国外相关应急组织的高度赞誉,为树立我国在国际反金融欺诈形象做出了极的贡献。 孙蔚敏 刘洋关键词:网络欺诈 金融机构 网上银行 CC 基于深度学习的实体关系联合抽取研究综述 被引量:3 2023年 实体关系抽取是信息抽取领域的核心任务.从文本中抽取的实体关系三元组是构建大规模知识图谱的基础.传统的流水线方法将实体关系抽取分解为独立的命名实体识别和关系抽取两个子任务.首先,构建一个高效的命名实体识别器,从大规模非结构化文本语句中识别实体边界和类型.然后,将该命名实体识别器识别的实体与类型作为关系抽取任务中所用数据的标注.最后,通过关系抽取器得到两个实体之间的关系类别,进而组合成为结构化的实体关系三元组.命名实体识别任务存在的误差会影响后续的关系抽取任务的性能,这使得流水线方法具有错误累积问题.这是因为关系抽取任务中使用的标注数据来自于前面的命名实体识别任务,这会有一定的误差,进而影响关系抽取的结果质量.此外,流水线方法减弱了两个子任务之间的特征关联,这会出现冗余实体的问题.命名实体识别任务和关系抽取任务独立进行学习训练,导致这两个子任务间缺乏交互,使得文本信息没有得到充分利用,限制了流水线方法的性能瓶颈.由于非结构化文本信息没有得到充分利用,流水线方法在抽取实体间长依赖关系时具有一定局限性,很难达到联合抽取模型的性能指标.实际应用中,实体间往往存在多种关系,流水线方法无法充分使用全局文本信息,且命名实体识别会产生冗余实体,在抽取多元重叠关系时,该方法具有一定的局限性.因此,在构建高准确率实体关系抽取模型时,流水线方法具有欠缺之处.本文对实体关系联合抽取的研究发展全景进行了综述,简要阐明整数线性规划、卡片金字塔解析模型、概率图模型和结构化预测模型这四类基于特征工程的联合模型的共同缺点.本文聚焦基于深度学习的实体关系联合抽取技术,根据近年来实体关系联合抽取前沿研究成果,总结了实体关系联合抽取模� 张仰森 刘帅康 刘洋 任乐 辛永辉关键词:信息抽取 知识图谱 面向域名解析系统的知识图谱构建与应用方法 2023年 为提高网络域名系统(domain name system,DNS)服务器日志分析能力,综合多种技术提出了构建面向域名解析系统的知识图谱。首先,应用域名解析、权威域名服务器、别名解析、自治系统等基本原理设计了基于aiohttp和dig技术相结合的数据采集方案,构建了相应的领域知识库;其次基于该知识库设计和构建了面向域名解析系统的知识图谱,其节点规模达近500万;然后应用该知识图谱解决web日志中异常访问行为识别效果差的实际问题。以某国家网络信息安全科研机构的网络服务器日志为研究对象,对比是否采用知识图谱进行实验:在爬虫行为、域名暴力解析行为、DNS重复解析行为的识别实验中,F1值分别提高了14.88%、47.23%和91.63%。结果表明,该知识图谱能够有效提高web日志中异常行为识别率。 胡昌秀 张仰森 刘洋 陈祥 辛永辉关键词:知识图谱 日志分析 域名解析系统 网络仿冒(Phishing)的威胁及防范 随着网络应用的不断发展,恶意代码编写者已从单纯的技术炫耀、追求自豪感,逐渐转到带有经济利益驱动甚至某种政治军事目的,网络资源的无序利用正在从无目标散乱的攻击转变为有组织、有目的的攻击,攻击的目标也从单个的主机转变为政府网... 孙蔚敏 刘洋文献传递 融合多模型和帧间信息的行人检测算法 被引量:14 2017年 行人检测在车辆辅助驾驶、视频监控、智能机器人等领域具有重要的应用价值.针对当前行人检测算法在视频分辨率低和背景复杂的情况下存在很多误检及漏检的问题,提出一种融合多模型和帧间信息的行人检测算法.首先融合Fast R-CNN和Faster R-CNN模型的互补检测结果获取精准的检测窗口;然后采用视频帧间上下文融合算法来弥补单帧图像检测算法存在的漏检和误检.实验结果表明,在Caltech行人检测数据库上,在每幅图像虚警率(FPPI)为10%的条件下,该算法丢失率仅为14.04%,比Faster R-CNN单模型丢失率(16.09%)降低2.05%;利用多模型和帧间信息融合对行人检测结果进行校正,能提高行人检测性能. 王斌 刘洋 刘洋 唐胜关键词:行人检测 卷积神经网络