叶允明
- 作品数:19 被引量:141H指数:6
- 供职机构:哈尔滨工业大学深圳研究生院更多>>
- 发文基金:国家自然科学基金上海市基础研究重大(重点)项目福建省自然科学基金更多>>
- 相关领域:自动化与计算机技术交通运输工程文化科学医药卫生更多>>
- 一种外贸物流路径的优化方法
- 本发明涉及一种外贸物流路径的优化方法,其解决了目前计算方法事实操作可行性不强,面对大规模的物流网络无法精确且成本高,无自适用学习能力。其通过建立无向图模型推到出期望值模型进行计算得出最优路径。其可广泛应用物流运输领域。
- 初佃辉叶允明李春山周学权王德泉
- 文献传递
- 京珠高速公路粤北段灾害气象防治与综合管理技术研究
- 李卫民安实关昌余林益恭侯相琛周岳华孟祥海邓敏维叶允明周海波王健钟丽萍雷云霄罗幸平马松林杨旭强谢秉磊王岢张文学刘锋谢毅宁卢树奀刘昆
- 该项目针对京珠高速公路粤北段交通事故频发、路/桥面冬季结冰以及交通综合治理信息提取速度慢、信息共享差等特征,系统地开展了灾害气象防治与交通综合管理技术研究。1、创新性成果(1)交通安全保障技术研究。揭示了不利气象条件下交...
- 关键词:
- 关键词:高速公路施工工艺
- 基于Web的远程监控系统的一种新方案被引量:22
- 2001年
- 介绍了一种以Java应用服务器为核心的基于Web的远程监督控系统 ,讨论了运用推技术提高数据传送的实时性 ,最后提出了一种Hello协议以解决主机崩溃问题。
- 王英华冯华叶允明徐宜中
- 关键词:远程监控系统推技术容错JAVA数据传送
- 基于标记树对象抽取技术的Hidden Web获取研究被引量:31
- 2002年
- 目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该文提出了一套检索HiddenWeb信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术。系统采用新的基于标记树的对象抽取(Tag-Tree-basedObjectExtraction)方法自动地从Web页面中抽取HiddenWeb信息,然后在此基础上给出了结构化的HiddenWeb信息查询算法。文章最后对实验结果进行了讨论。
- 宋晖张岭叶允明马范援
- 关键词:标记树对象抽取信息检索结构化查询
- 分布式Web Crawler的研究:结构、算法和策略被引量:33
- 2002年
- 本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于“滞后合并”策略的UBL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页.
- 叶允明于水马范援宋晖张岭
- 关键词:WEB爬虫分布式系统计算机网络网页
- 基于流水线负载平衡模型的并行爬虫研究被引量:3
- 2009年
- 针对并行爬虫系统在多任务并发执行时所遇到的模块间负载平衡问题,提出流水线负载平衡模型(PLB),将不同的任务抽象为独立模块而达到各模块的处理速度相等,采用多线程的方式实现基于PLB的并行爬虫,根据线程的休眠和缓冲区的变化对线程数量进行动态调整以实现PLB。实验结果表明该方法具有良好的运行效率和稳定性。
- 孟祥乾叶允明邓斌
- 关键词:爬虫流水线负载平衡
- 一种新的网络爬虫带宽控制策略被引量:2
- 2008年
- 网络爬虫如何在限定带宽的条件下进行爬行是一个有巨大应用价值的问题,但是目前对这个方面的研究较少,本文提出了一种基于对站点礼貌爬行的爬虫带宽控制策略,通过对不同站点下载速度的建模分析和基于礼貌爬行的访问频率控制,得到了面向站点的爬行控制算法,最后实验证明这种方法能够充分利用所限定的带宽。
- 孟祥乾叶允明
- 关键词:网络爬虫
- 全球传染病疫情信息自动收集系统的研发被引量:7
- 2017年
- 目的利用人工智能技术构建全球传染病疫情信息自动收集系统。方法采用主题爬虫、自动化信息抽提、自动翻译、自然语言处理等技术实现目标网页和目标信息的自动获取,通过机器深度学习和数据挖掘等技术制作日报,并持续改进;搭建网站作为数据交互载体,方便用户使用。结果租用境内外服务器,构建了基于网络的全球传染病疫情信息自动收集系统,每天两次自动爬取全球传染病疫情信息,自动翻译为中文,生成快报。搭建了网站,方便人机交互,将结果以网页形式展示,并能够根据用户需求自动生成疫情报告。结论传染病疫情自动收集系统覆盖面广、效率高,能自动生成疫情报告,能够满足国境口岸疫情收集的需要。
- 王相军刘春晓刁慕言何建安顾大勇史蕾赵纯中叶允明田桢干李深伟
- 关键词:传染病疫情
- 用IP隧道实现分布式控制网络的研究被引量:4
- 2000年
- 本文介绍了以IP隧道技术实现分布式的控制网络 ,讨论IP隧道的基本原理、数据包封装、地址解析以及地址表的建立与刷新等。
- 叶允明郑文波
- 关键词:IP隧道控制网络分布式系统INTERNET网
- 基于Web的远程监控系统的一种新方案被引量:30
- 2001年
- 介绍一种以Java应用服务器为核心的基于Web的远程监控系统 ,讨论了运用推技术提高数据传送的实时性 。
- 叶允明林宏基
- 关键词:WEB推技术远程监控系统容错数据传送