使用GANOS实现洪涝灾害承灾体损失综合评估

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
简介: 利用Ganos的时空栅格存储、计算和分析能力,将复杂的洪涝承灾体损失计算模型转化为简单的Geo-SQL语句,使得过去必须借助于GIS软件的专业的时空数据处理流程能在数据库内实现,简化用户的程序逻辑,降低开发复杂度与维护成本, 使云GIS能力赋能行业用户。

1. 简介

洪涝灾害是我国目前面临的最主要的自然灾害,利用洪涝灾害承灾体损失综合评估模型,对灾害损失率和损失价值分布进行科学地计算,对于指导洪涝救灾、建立灾害预警机制、加强洪涝灾害成灾机制的研究,建立和完善更科学、更准确的洪灾损失评估预测体系具有重要的意义。

1.1 模型简介

该模型利用洪水灾害淹没水深分布,结合承灾体类型、承灾体价值及脆弱性数据,计算灾害损失率和损失价值分布。

1.1.1 数据输入

输入的数据包括:

  1. 洪水淹没水深分布
  2. 土地利用类型分布
  3. 土地利用价值分布
  4. 土地利用淹没水深-损失率对照表

    1.1.2 数据计算

  5. 承灾体损失率计算公式:

DR=f(H)
其中DR为每类承灾体的损失率;H为致灾因子强度;f为致灾因子和损失率映射关系。

  1. 承灾体损失价值计算公式:

Loss = DR * E
其中Loss为损失价值,DR为灾害损失率,E为承灾体价值。

1.1.3 数据输出

  1. 洪涝灾害损失率分布
  2. 洪涝灾害损失价值分布

    1.2 Ganos

Ganos是阿里云自研的时空数据库引擎,包含了几何,栅格,点云,几何网络和轨迹模型5大数据模型,支持RDS POSTGRESQL 和 POLARDB-PG产品。其中针对时空栅格数据类型,Ganos提供了超大规格栅格数据存储、计算能力,单幅栅格数据理论上无容量限制,具备全球一张图的管理能力,使得传统GIS中复杂的栅格分析操作可以使用Geo-SQL轻松实现,并具备了与几何数据类型统一分析能力。 具体函数参见 https://help.aliyun.com/document_detail/107567.html?spm=a2c4g.11174283.6.1130.17634c22GrQgYR

地图代数是栅格分析与GIS建模中常用技术方法。Ganos为栅格图层计算操作提供了栅格代数表达式语言和一组栅格代数函数,称为ACL(Algebra Computing Language)。 ACL包括通用算术运算符,逻辑运算符,位运算,关系运算符以及一组统计函数,并允许它们自由组合使用,实现更为复杂的运算操作。Ganos 栅格借助于ACL强大的计算表达式,支持基于一个或多个栅格对象像元值的条件查询,数学建模,分类操作以及生成新的结果栅格对象。

PL/pgSQL与ACL结合使用,则提供了更为强大的易用的栅格分析工具。PL/pgSQL提供变量和常量的声明,通用数学表达式,基本函数,逻辑判断和流程控制,ACL为栅格计算提供像元代数计算的表达方式。用户可以轻松地结合两种的优势进行时空栅格的分析与建模,如对全球年平均气温做减法(-)运算以便获得全球气温变化趋势。

本案例中用到了空间参考投影变换, 栅格分辨率修改, 像素值重分类和栅格代数运算四个功能。

1.2.1 空间参考重投影

ST_Transform函数对栅格数据做空间参考的变换。数据来源不同导致数据的空间参考不同,通过本函数可以将不同来源的数据统一到同一个空间参考系统中。
1574733249245_f5f8d106_c8f0_4a32_bdb2_d64521de4396

1.2.2 空间分辨率修改

ST_Resize函数根据用户指定的尺寸和重采样方法对栅格数据进行变换,变化结果对应的地理空间范围保持不变。数据来源的不同导致栅格数据的空间分辨率不尽相同,通过本函数可以将不同的栅格数据确保具备有相同的空间分辨率以便进行下一步计算分析。
1574682328819_497049e6_6760_4bf7_a552_be2017efb318

1.2.3 像素值重分类

ST_Reclassify函数按照用户指定的规则对栅格数据的像素值进行分类,从而获得一个新的栅格数据。
1574682878687_9d0edbdb_d2ac_4a9e_86e5_1db11b10ca7b

1.2.4 地图代数运算

ST_MapAlgebra函数使用特定的代数计算表达式对栅格数据的每个像素值进行计算,获得一个新的栅格数据。借助于强大的代数计算表达式,用户可以非常方便地对栅格数据进行运算操作
1574748886046_79f1ac00_cdba_42d3_97b4_42d46e4c4a23

2. 实战步骤

以海口市台风“海鸥”(201418)洪水灾害为例,计算承灾体洪水灾害损失率和损失价值分布。具体计算步骤如下:

2.1 数据入库

数据入库时可以根据需要对数据进行预处理,如使用ST_Transform进行投影变换、ST_Resize修改分辨率等操作,从而获得指定的空间参考和分辨率:

-- 数据表
create table loss(name varchar(20), rast raster);

-- 导入为指定空间参考和空间分辨率
-- 土地利用类型
INSERT INTO loss values('land_type', ST_Resize(
    ST_Transform(
        ST_CreateRast('<OSS_PATH>/landuse_type_haikou_2015_Albers_30m.tif'), 
            4326, 
      '{"resample":"Near","nodata":true}', 
      '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}'), 
    1000, 
    1000, 
    '{"resample":"Near","nodata":true}', 
    '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}'));

-- 洪水深度
INSERT INTO loss values('flood_height', ST_Resize(
  ST_Transform(
     ST_CreateRast('<OSS_PATH>/TC_ID_Uniq_201418_Kalmaegi_flood_depth_max_WGS84.tif'), 
        4326, 
        '{"resample":"Near","nodata":true}', 
        '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}'), 
     1000, 
     1000, 
     '{"resample":"Near","nodata":true}', 
     '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}'));


-- 土地价值
INSERT INTO loss values('land_value', ST_Resize(
  ST_Transform(
     ST_CreateRast('<OSS_PATH>/landuse_value_haikou_2015_Albers_30m.tif'), 
        4326, 
        '{"resample":"Near","nodata":true}', 
        '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}'), 
     1000, 
     1000, 
     '{"resample":"Near","nodata":true}', 
     '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}'));

2.2 承灾体损失率计算

  1. 对不同土地利用进行赋值,属于该类别赋值1,否则为0,获得单种土地利用分布图

    -- 以type=21 有林地为例
    INSERT INTO loss (name, rast)
    SELECT 'land_type21', ST_Reclassify(rast, '[{"band":0, "remap":{"[0,21)":"0","21":"1","(21,254]":"0"}, "nodata":true, "nodatavalue":255}]', '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}')
    FROM loss
    WHERE name='land_type';
    
  2. 洪水淹没水深与各类土地利用赋值结果相乘,得出各类土地利用淹没深度

    -- 使用表达式[0,0] * [1,0] 进行相乘操作
    WITH foo as
    (
    SELECT rast from loss WHERE name in ('flood_height', 'land_type21' )
    )
    INSERT INTO loss (name, rast)
    SELECT 'flood_height_type21', ST_MapAlgebra(ARRAY(select rast from foo), 
    '[{"expr":"([0,0] * [1,0])","nodata": true, "nodataValue":255}]',
    '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table", "celltype":"64BF"}');
    
  3. 按照各类土地利用淹没水深-损失率对照表,对淹没深度进行重分类,赋予对应土地利用类型相应的损失率

    -- 按照洪水深度重新赋值
    INSERT INTO loss (name, rast)
    SELECT 'ratio_type21', ST_Reclassify(rast, '[{"band":0, "remap":{"[0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.9,1.2,1.5,1.8,2.1,2.4,2.7,3,254)":"0,1.5,2.5,4,7,10,13,15,20,24,27,30,30,30,30,30"}, "nodata":true, "nodatavalue":255}]', '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}')
    FROM loss
    WHERE name='flood_height_type21';
    
  4. 有林地土地利用类型对应的损失率图效果

1573558702590_edabf4fd_f995_4c08_baa4_57e127c0d699

2.3 承灾体损失值计算

依照公式2, 将承灾体价值和损失率进行栅格相乘,得到承灾体损失价值分布:

WITH foo as
 (
  SELECT rast from loss WHERE name in ('land_value', 'ratio_type21' )
 )
 INSERT INTO loss (name, rast)
 SELECT 'loss_type21', ST_MapAlgebra(ARRAY(select rast from foo), 
 '[{"expr":"([0,0] * [1,0])","nodata": true, "nodataValue":255}]',
 '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table", "celltype":"64BF"}');

有林地洪灾损失价值分布图如下:
1573558615822_5fa3993b_e159_4680_a8f9_7dc1abf4659e

2.4 单SQL执行

当然,也可以把之前所有的SQL都组合到一起直接进行计算,同样以有林地为例:

-- 把以上几个步骤串联到一起
-- 对结果数据的空间参考和分辨率进行预定义
-- 数据写入临时 tmp_chunk_table 表中,后续可以进行删除
WITH loss AS (
    SELECT 'land_type' as name, ST_Resize(
  ST_Transform(
    ST_CreateRast('<OSS_PATH>/landuse_type_haikou_2015_Albers_30m.tif'), 
      4326, -- 最终结果SRID
      '{"resample":"Near","nodata":true}', 
      '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}'), 
    1000,  -- 最终结果分辨率X
    1000, -- 最终结果分辨率Y
    '{"resample":"Near","nodata":true}', 
    '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}') AS rast
UNION ALL
    SELECT 'flood_height' as name, ST_Resize(
  ST_Transform(
     ST_CreateRast('<OSS_PATH>/TC_ID_Uniq_201418_Kalmaegi_flood_depth_max_WGS84.tif'), 
        4326, -- 最终结果SRID
        '{"resample":"Near","nodata":true}', 
        '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}'), 
     1000, -- 最终结果分辨率X
     1000, -- 最终结果分辨率Y
     '{"resample":"Near","nodata":true}', 
     '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}') AS rast
UNION ALL
    SELECT 'land_value' as name, ST_Resize(
  ST_Transform(
     ST_CreateRast('<OSS_PATH>/landuse_value_haikou_2015_Albers_30m.tif'), 
        4326, -- 最终结果SRID
        '{"resample":"Near","nodata":true}', 
        '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}'), 
     1000, -- 最终结果分辨率X
     1000, -- 最终结果分辨率Y
     '{"resample":"Near","nodata":true}', 
     '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}') AS rast
),
land_type AS (
SELECT ST_Reclassify(rast, 
              '[{"band":0, "remap":{"[0,21)":"0","21":"1","(21,254]":"0"},"nodata":true, "nodatavalue":255}]', 
          '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}') AS rast
  FROM loss
  WHERE name='land_type'), 
flood_height AS (
SELECT ST_MapAlgebra(ARRAY(select rast from land_type 
                           UNION ALL 
                           select rast from loss WHERE name='flood_height'), 
                 '[{"expr":"([0,0] * [1,0])","nodata": true, "nodataValue":255}]',
                 '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table", "celltype":"64BF"}') AS rast
),
loss_ratio AS (
SELECT ST_Reclassify(rast, 
                        '[{"band":0, "remap":{"[0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.9,1.2,1.5,1.8,2.1,2.4,2.7,3,254)":"0,1.5,2.5,4,7,10,13,15,20,24,27,30,30,30,30,30"}, "nodata":true, "nodatavalue":255}]', 
            '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table"}') AS rast
    FROM flood_height),
foo AS (
  SELECT rast from loss WHERE name in ('land_value')
UNION ALL
  SELECT rast from loss_ratio
)
SELECT 'loss_type21', ST_MapAlgebra(ARRAY(select rast from foo), 
    '[{"expr":"([0,0] * [1,0])","nodata": true, "nodataValue":255}]',
    '{"chunking":true,"chunkdim":"(256,256,1)","compression":"lz4","interleaving":"bsq","chunktable":"tmp_chunk_table", "celltype":"64BF"}');

是不是感觉很神奇呢?

3. 总结

利用Ganos的时空栅格存储、计算和分析能力,将复杂的洪涝承灾体损失计算模型转化为简单的Geo-SQL语句,使得过去必须借助于GIS软件的专业的时空数据处理流程能在数据库内实现,简化用户的程序逻辑,降低开发复杂度与维护成本, 使云GIS能力赋能行业用户。

关于TST

阿里云TST团队(Team of Spatio-Temporal kernel)由来自计算机、GIS、遥感等不同领域技术专家构成,是怀揣共同梦想——让80%行业用到时空云计算、迸发着活力和激情的一群创业者。团队主攻云上空间\时空内核引擎技术架构、算法、系统平台研发与应用,致力于将GIS与时空信息处理嵌入到PaaS云计算基础设施,使之成为新一代数字框架的基础维度普惠到更多用户

相关实践学习
DataV Board用户界面概览
本实验带领用户熟悉DataV Board这款可视化产品的用户界面
阿里云实时数仓实战 - 项目介绍及架构设计
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3&nbsp;)前置知识要求 &nbsp; 课程大纲 第一章&nbsp;了解数据仓库概念 初步了解数据仓库是干什么的 第二章&nbsp;按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章&nbsp;数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章&nbsp;采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章&nbsp;用户行为数据仓库 严格按照企业的标准开发 第六章&nbsp;搭建业务数仓理论基础和对表的分类同步 第七章&nbsp;业务数仓的搭建&nbsp; 业务行为数仓效果图&nbsp;&nbsp;
目录
相关文章
|
8月前
|
机器学习/深度学习 数据采集 搜索推荐
多模型DCA曲线:如何展现和解读乳腺癌风险评估模型的多样性和鲁棒性?
多模型DCA曲线:如何展现和解读乳腺癌风险评估模型的多样性和鲁棒性?
186 1
|
机器学习/深度学习
评分是机器学习领域中的一种评估模型性能的指标
评分是机器学习领域中的一种评估模型性能的指标
106 1
|
2天前
|
机器学习/深度学习 PyTorch 测试技术
LossVal:一种集成于损失函数的高效数据价值评估方法
LossVal是一种创新的机器学习方法,通过在损失函数中引入实例级权重,直接在训练过程中评估数据点的重要性,避免了传统方法中反复重训练模型的高计算成本。该方法适用于回归和分类任务,利用最优传输距离优化权重,确保模型更多地从高质量数据中学习。实验表明,LossVal在噪声样本检测和高价值数据点移除等任务上表现优异,具有更低的时间复杂度和更稳定的性能。论文及代码已开源,为数据价值评估提供了高效的新途径。
30 13
LossVal:一种集成于损失函数的高效数据价值评估方法
|
8月前
|
数据采集 机器学习/深度学习 算法
多维因素与学生辍学风险预测
多维因素与学生辍学风险预测
|
7月前
|
存储 人工智能 缓存
大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度
【6月更文挑战第26天】无问芯穹Qllm-Eval评估了11个大模型(如OPT、LLaMA2)在多种参数配置和任务下的量化效果,探索权重量化、激活量化等方法对性能、速度和内存的影响。研究发现,W4、W4A8量化通常保持在2%的性能损失范围内,但最佳策略取决于模型大小、任务类型及硬件,提示了选择压缩方案时需灵活适应。[[arxiv.org/pdf/2402.18158.pdf](https://arxiv.org/pdf/2402.18158.pdf)]
109 6
|
8月前
|
存储 数据挖掘
R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列
R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列
|
8月前
|
机器学习/深度学习 数据可视化 算法
R语言贝叶斯广义线性混合(多层次/水平/嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据
R语言贝叶斯广义线性混合(多层次/水平/嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据
|
8月前
|
存储 资源调度 数据可视化
R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性
R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性
|
8月前
|
存储 数据可视化
Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险/收益可视化
Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险/收益可视化
Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险/收益可视化
|
8月前
|
数据采集 数据挖掘
多维因素与学生辍学风险预测附录
多维因素与学生辍学风险预测附录