滑坡空间易发性统计模型的构建需要正样本(滑坡点)和负样本(非滑坡点)两类数据,但历史观测数据仅记录了正样本,而负样本的选取容易受到正样本污染,因为没有滑坡记录的地方也可能在过去或未来发生滑坡,从而导致模型的预测精度与稳定性受到影响。针对此问题,将前期提出的半监督学习算法PBLC(positive and background learning with constraints)应用于滑坡空间易发性分析,探讨其解决负样本污染问题的有效性。本文以粤东地区为研究区,选择高程、坡度、坡向、剖面曲率、距离道路最短距离、距离断层线最短距离、距水系最短距离、年平均降雨量、归一化植被指数和地理坐标共11个影响因子作为环境变量。结果表明,与传统的人工神经网络模型相比,基于PBLC算法的预测概率取值范围更为合理,预测结果更加稳定,且预测精度随背景样本数量增加而提高;粤东地区的滑坡灾害高易发区集中于北部和西南区域,坡度和高程是影响该地区滑坡易发性的主要因子。结果表明,半监督学习算法PBLC可以有效解决滑坡统计建模过程负样本污染的问题,提高模型预测精度。
建成环境的高空间异质性与致灾过程的复杂性给城市暴雨内涝研究带来巨大的挑战,具体表现为模型代表性不够、计算效率低、基础数据和验证数据匮乏。以机器学习为代表的人工智能技术、高分遥感和互联网大数据的快速发展则为城市暴雨内涝研究提供了新的契机。论文结合人工智能、高分遥感和互联网大数据等新技术发展,从特征、机理、数据与方法4个维度对暴雨内涝的研究现状和发展趋势进行了系统总结,主要结论包括:(1)暴雨内涝具有短历时性、空间散布性、连锁性和突变性,其热点呈现空间上的动态迁移特征。(2)降雨时空特征和城市化程度决定暴雨内涝灾害的量级,地形条件尤其是微地形则决定发生位置和内涝频率。地形控制作用指数(topographic control index,TCI)对暴雨内涝发生位置具有良好的指示能力。(3)排水管网、高精度地形和不透水面分布是暴雨内涝模拟的关键基础数据;降雨过程的高时空变异性是暴雨内涝近实时预报预警的主要瓶颈,需要充分利用天气雷达观测提高其精准度;互联网众包大数据是获取高空间覆盖度暴雨内涝灾情信息的新途径,但也面临不同类型信息融合、提炼和质量控制的挑战。(4)结合水动力模拟与机器学习可建立兼具物理基础和计算效率的暴雨内涝模拟方法,是实现近实时模拟与快速预报预警的有效途径。