GaussDB在IoT大数据场景的创新实践

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 近日,在深圳举办的ArchSummit全球架构师峰会上,华为GaussDB生态与标准CTO王伟民发表了“IoT大数据场景下华为GaussDB的数据处理实践”主题演讲,分享了大数据场景下华为GaussDB的数据处理实践。在数据爆炸式增长的时代,企业在进行海量数据分析与处理时面临四大挑战:l 极致的弹性扩缩容能力,满足海量数据处理需求l 系统具备极高的可用性,满足7 * 24 * 365不间断持续运营诉求l 具备实时性分析能力,对服务体验、精准的个性化服务要求不断提高l 基础平台必须对应用开发友好,易管理易运维,满足业务创新加速,且在运维运营、变更等方面具有可视化、智能

近日,在深圳举办的ArchSummit全球架构师峰会上,华为GaussDB生态与标准CTO王伟民发表了“IoT大数据场景下华为GaussDB的数据处理实践”主题演讲,分享了大数据场景下华为GaussDB的数据处理实践。

在数据爆炸式增长的时代,企业在进行海量数据分析与处理时面临四大挑战:

l 极致的弹性扩缩容能力,满足海量数据处理需求

l 系统具备极高的可用性,满足7 24 365不间断持续运营诉求

l 具备实时性分析能力,对服务体验、精准的个性化服务要求不断提高

l 基础平台必须对应用开发友好,易管理易运维,满足业务创新加速,且在运维运营、变更等方面具有可视化、智能化能力

面对这些挑战,王伟民重点介绍了GaussDB的架构和关键特性,并通过三大案例介绍了GaussDB如何应对海量数据场景下面临的挑战、所应用的关键技术以及产生的业务价值。

PB级金融数仓迁移

GaussDB支撑某大行利用分布式数仓,对传统架构的数仓进行改造、向云化演进。该行的企业数据集成系统、企业数据仓库系统均采用商业一体机解决方案,另有数十个面向不同主题的数据集市。

由于数据规模及计算能力的要求,本系统当前已达240节点。大集群组网是分布式系统的一大关键挑战,GaussDB通过TCP多流链接共享技术,突破了物理端口限制;同时整个集群采用了“Fat-Tree”组网,来消除集群内上行、下行带宽瓶颈。

针对每日新增TB级数据的需求,GaussDB提供并行数据加载工具(GDS)提高数据加载速度。优化后单DN加载速度可达30MB/s,集群可达到TB/h (视DN数有关)。极致的加载速度是迁移PB级数据的关键能力,GDS并行加载性能业界领先,得到客户高度认可。

面对企业数仓规模不断扩大的需求,GaussDB能够实现按需扩展,满足业务增长对存储和性能的要求,降低TCO。2018年9月,GaussDB成功实现跨园区数据无损搬迁。2018年12月,原数据仓库系统100%搬迁。2019年6月30日,原数据仓库全部下线。

平安城市多源数据、异构融合分析

GaussDB支撑某平安城市场景,该场景存在三大挑战:多类型数据分析平台孤立建设,数据分散,无法拉通分析;受限于成本和架构,且随着数据量增加,扩容成本高;应对突发事件,需要实时对相关数据进行取证,已有系统交互分析响应时间长。因此,亟需具备高性价比、弹性可扩展、支持交互分析的平台。

在平安城市典型的“套牌车分析”场景中,某市有数千个智能卡口,集中存放约6000万过车记录。GaussDB在MPP并行计算框架基础上,利用列存向量化技术,可以秒级完成套牌车分析。

平安城市中涉及到多源融合分析场景。GaussDB的SQL On Anywhere特性可实现不搬迁Hadoop原有数据即可使用数仓的分析能力。

“以图搜图”是平安城市的重要应用场景,GaussDB利用CPU/GPU异构加速分析,实现秒级“以图搜图”。

极致高可用在线交易

“分布式在线交易数据库”在新金融下的应用实践。某零售银行的业务模式从“网上银行”过渡到“App银行”时代。App银行的月活跃用户在8000万~1亿,为保证买手机游戏账号海量用户的体验,零数据丢失及高可用非常关键。

首先,业务关键型负载通常希望7 * 24不间断服务,实现99.995%或99.999%的SLA,这意味着系统在零数据丢失前提下RTO尽可能小。GaussDB通过在同AZ(可用区)内的独立服务器或备机上设立全局缓冲池。在故障切换时,备库通过访问全局缓冲池而不是磁盘获取数据页面进行前滚,大幅降低RTO。

其次,当前金融系统普遍采用“同城生产及应急、异地容灾”的两地三中心架构,以满足监管要求。GaussDB引入了Paxos协议,用于分布式多副本的一致性保障,一致性仲裁决策路径短,效率高。

三个真实业务案例,充分展示了GaussDB在PB级融合数仓、多模异构分析、极致高可用交易数据库的能力,助力金融、平安城市等各行业客户实现业务创新。

截至目前,华为GaussDB和FusionInsight数据库已经应用于全球60个国家及地区,服务于1500多个客户,拥有500多家商业合作伙伴,并广泛应用于金融、运营商、政府、能源、医疗、制造、交通等多个行业。根据数据中心联盟最近发布的第八批大数据产品评测结果,华为GaussDB率先通过了512节点分布式分析型数据库基础能力评测。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
SQL 分布式计算 运维
如何对付一个耗时6h+的ODPS任务:慢节点优化实践
本文描述了大数据处理任务(特别是涉及大量JOIN操作的任务)中遇到的性能瓶颈问题及其优化过程。
|
1月前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
54 4
|
9天前
|
边缘计算 人工智能 搜索推荐
大数据与零售业:精准营销的实践
【10月更文挑战第31天】在信息化社会,大数据技术正成为推动零售业革新的重要驱动力。本文探讨了大数据在零售业中的应用,包括客户细分、个性化推荐、动态定价、营销自动化、预测性分析、忠诚度管理和社交网络洞察等方面,通过实际案例展示了大数据如何帮助商家洞悉消费者行为,优化决策,实现精准营销。同时,文章也讨论了大数据面临的挑战和未来展望。
|
10天前
|
存储 JSON 运维
智能物联网平台:Azure IoT Hub在设备管理中的实践
【10月更文挑战第26天】随着物联网技术的发展,Azure IoT Hub成为企业管理和连接数百万台设备的强大平台。本文介绍Azure IoT Hub的设备管理功能,包括设备注册、设备孪生、直接方法和监控诊断,并通过示例代码展示其应用。
17 4
|
1月前
|
存储 分布式计算 druid
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
52 1
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
|
1月前
|
SQL 存储 分布式计算
大数据-157 Apache Kylin 背景 历程 特点 场景 架构 组件 详解
大数据-157 Apache Kylin 背景 历程 特点 场景 架构 组件 详解
23 9
|
1月前
|
存储 缓存 NoSQL
大数据-38 Redis 高并发下的分布式缓存 Redis简介 缓存场景 读写模式 旁路模式 穿透模式 缓存模式 基本概念等
大数据-38 Redis 高并发下的分布式缓存 Redis简介 缓存场景 读写模式 旁路模式 穿透模式 缓存模式 基本概念等
54 4
ly~
|
1月前
|
供应链 监控 搜索推荐
大数据的应用场景
大数据在众多行业中的应用场景广泛,涵盖金融、零售、医疗保健、交通物流、制造、能源、政府公共服务及教育等领域。在金融行业,大数据用于风险评估、精准营销、反欺诈以及决策支持;零售业则应用于商品推荐、供应链管理和门店运营优化等;医疗保健领域利用大数据进行疾病预测、辅助诊断和医疗质量评估;交通物流业通过大数据优化物流配送、交通管理和运输安全;制造业则在生产过程优化、设备维护和供应链协同方面受益;能源行业运用大数据提升智能电网管理和能源勘探效率;政府和公共服务部门借助大数据改善城市管理、政务服务及公共安全;教育行业通过大数据实现个性化学习和资源优化配置;体育娱乐业则利用大数据提升赛事分析和娱乐制作水平。
ly~
302 2
|
2月前
|
人工智能 编解码 搜索推荐
大模型、大数据与显示技术深度融合 加速智慧医疗多元化场景落地
大模型、大数据与显示技术深度融合 加速智慧医疗多元化场景落地
|
1月前
|
SQL 消息中间件 分布式计算
大数据-143 - ClickHouse 集群 SQL 超详细实践记录!(一)
大数据-143 - ClickHouse 集群 SQL 超详细实践记录!(一)
65 0

热门文章

最新文章

下一篇
无影云桌面