Apache Doris 2.1.8 版本正式发布

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 该版本持续在湖仓一体、异步物化视图、查询优化器与执行引擎、存储管理等方面进行改进提升与问题修复,进一步加强系统的性能和稳定性,欢迎大家下载体验。

亲爱的社区小伙伴们,Apache Doris 2.1.8 版本已于 2025 年 01 月 24 日正式发布。 该版本持续在湖仓一体、异步物化视图、查询优化器与执行引擎、存储管理等方面进行改进提升与问题修复,进一步加强系统的性能和稳定性,欢迎大家下载体验。

行为变更

  • 添加环境变量 SKIP_CHECK_ULIMIT 以跳过 BE 进程内关于 ulimit 值校验检查,仅适用于 Docker 快速启动场景中应用。#45267
  • 添加 enable_cooldown_replica_affinity session 变量控制冷热分层下查询选用副本亲和性
  • FE 添加配置restore_job_compressed_serializationbackup_job_compressed_serialization 用于解决 db tablet 数量非常大情况下备份和恢复操作时 FE OOM 的问题,打开之后无法降级

新功能

  • 查询执行引擎:Arrowflight 协议支持通过负载均衡设备访问 BE。 #43281
  • 其他:当前 Lambda 表达式支持捕获外部的列。 #45186

改进提升

湖仓一体

  • Hudi 版本更新至 0.15,并且优化了 Hudi 表的查询规划性能。
  • 优化了 MaxCompute 分区表的读取性能。 #45148
  • 支持会话变量 enable_text_validate_utf8,可以忽略 CSV 格式中的 UTF8 编码检测。#45537
  • 优化在高过滤率情况下,Parquet 文件延迟物化的性能。#46183

异步物化视图

  • 现在支持手动刷新异步物化视图中不存在的分区。#45290
  • 优化了透明改写规划的性能。#44786

查询优化器

  • 提升了 Runtime Filter 的自适应能力。#42640
  • 增加了在 MAX / MIN 聚合函数列上的过滤条件生成原始列过滤条件的能力。#39252
  • 增加了在连接谓词上抽取单测过滤条件的能力。#38479
  • 优化了谓词推导在集合算子上的能力,可以更好的生成过滤谓词。#39450
  • 优化了统计信息收集和使用的异常处理能力,避免在收集异常时产生非预期的执行计划。#43009 #43776 #43865 #42104 #42399 #41729

查询执行引擎

  • Resource group 支持在当前 group 不可用的时候,降级到别的 Group. #44255
  • 优化带 limit 的查询执行使其能够更快的结束,避免多余的数据扫描。#45222

存储管理

  • CCR 支持了更加全面的操作,比如 Rename Table,Rename Column,Modify Comment,Drop View,Drop Rollup 等。
  • 提升了 Broker Load 导入进度的准确性和多个压缩文件导入时的性能。
  • 改进了 Routine Load 超时策略、线程池使用以防止 Routine Load 超时失败和影响查询。

其他

  • Docker 快速启动镜像支持不设置环境参数直接启动,添加环境变量 SKIP_CHECK_ULIMIT 以跳过 start_be.sh 脚本以及 BE 进程内关于 swapmax_map_countulimit 相关校验检查,仅适用于 Docker 快速启动场景中应用。#45269
  • 新增 LDAP 配置型 ldap_group_filter 用于自定义 Group 过滤。#43292
  • 优化了使用 Ranger 时的性能。#41207
  • 修复审计日志中,scan bytes 统计不准的问题。#45167
  • 在 COLUMNS 系统表中能够正确显示列的默认值。#44849
  • 在 VIEWS 系统表中能够正确显示视图的定义。#45857
  • 当前,admin 用户不能被删除。#44751

Bug 修复

湖仓一体

  • Hive

    • 修复无法查询 Spark 创建的 Hive 视图的问题。#43553

    • 修复无法正确读取某些 Hive Transaction 表的问题。#45753

    • 修复 Hive 表分区存在特殊字符时,无法进行正确分区裁剪的问题。#42906

  • Iceberg

    • 修复在 Kerberos 认证环境下,无法创建 Iceberg 表的问题。#43445

    • 修复某些情况下,Iceberg 表存在 dangling delete 情况下,count(*) 查询不准确的问题。#44039

    • 修复某些情况下,Iceberg 表列名不匹配导致查询错误的问题#44470

    • 修复某些情况下,当 Iceberg 表分区被修改后,无法读取的问题#45367

  • Paimon

    • 修复 Paimon Catalog 无法访问阿里云 OSS-HDFS 的问题。#42585
  • Hudi

    • 修复某些情况下,Hudi 表分区裁剪失效的问题。#44669
  • JDBC

    • 修复某些情况下,开始表名大小写不敏感功能后,使用 JDBC Catalog 无法获取表的问题。
  • MaxCompute

    • 修复某些情况下,MaxCompute 表分区裁剪失效的问题。#44508
  • 其他

    • 修复某些情况下,Export 任务导致 FE 内存泄露的问题。#44019

    • 修复某些情况下,无法使用 HTTPS 协议访问 S3 对象存储的问题。#44242

    • 修复某些情况下,Kerberos 认证票据无法自动刷新的问题。#44916

    • 修复某些情况下,读取 Hadoop Block 压缩格式文件出错的问题。#45289

    • 查询 ORC 格式的数据时,不再下推 CHAR 类型的谓词,以避免可能的结果错误。#45484

异步物化视图

  • 修复了当物化视图定义中存在 CTE 时,无法刷新的问题。#44857
  • 修复了当基表增加列后,异步物化视图不能命中透明改写的问题。#44867
  • 修复了当查询中在不同位置包含相同的过滤谓词时,透明改写失败的问题。#44575
  • 修复了当过滤谓词或连接谓词中使用列的别名时,无法透明改写的问题。#44779

索引

  • 修复倒排索引 Compaction 异常处理的问题 #45773
  • 修复倒排索引构建因为等锁超时失败的问题 #43589
  • 修复异常情况下倒排索引写入 Crash 的问题。#46075
  • 修复 Match 函数特殊参数时空指针的问题 #45774
  • 修复 VARIANT 倒排索引相关的问题,禁用 VARIANT 使用索引 v1 格式。#43971 #45179

  • 修复 NGram Bloomfilter Index 设置 gram_size = 65535 时 Crash 的问题。#43654

  • 修复 Bloomfilter Index 计算 DATE 和 DATETIME 不对的问题。#43622
  • 修复 Drop Coloumn 没有自动 Drop Bloomfilter Index 的问题。#44478
  • 减少 Bloomfilter Index 写入时的内存占用。#46047

半结构化数据类型

  • 优化内存占用,降低 VARIANT 数据类型的内存消耗。#43349 #44585 #45734
  • 优化 VARIANT Schema Copy 性能。#45731
  • 自动推断 Tablet Key 时不将 VARIANT 作为 Key。#44736
  • 修复 VARIANT 从 NOT NULL 改成 NULL 的问题。#45734
  • 修复 Lambda 函数类型推断错误的问题。#45798
  • 修复 ipv6_cidr_to_range 函数边界条件 Coredump。#46252

查询优化器

  • 修复了潜在的表读锁互斥导致的死锁问题,并优化了锁的使用逻辑#45045 #43376 #44164 #44967 #45995
  • 修复了 SQL Cache 功能错误的使用常量折叠导致在使用包含时间格式的函数时结果不正确的问题。#44631
  • 修复了比较表达式优化,在边缘情况下可能优化错误,导致结果不正确的问题。#44054 #44725 #44922 #45735 #45868
  • 修复高并发点查审计日志不正确的问题。 #43345 #44588
  • 修复高并发点查遇到异常后持续报错的问题。#44582
  • 修复部分字段 Prepared Statement 不正确的问题。#45732

查询执行引擎

  • 修复了正则表达式和 LIKE 函数在特殊字符时结果不对的问题。#44547
  • 修复 SQL Cache 在切换 DB 的时候结果可能不对的问题。#44782
  • 修复cut_ipv6 函数结果不对的问题。#43921
  • 修复数值类型到 bool 类型 cast 的问题。#46275
  • 修复了一系列 Arrow Flight 相关的问题。#45661 #45023 #43960 #43929
  • 修复了当 hashjoin 的 hash 表超过 4G 时,部分情况结果错误的问题。#46461
  • 修复了 convert_to 函数在中文字符时溢出的问题。#46505

存储管理

  • 修复高并发 DDL 可能导致 FE 启动失败的问题。
  • 修复自增列可能出现重复值的问题。
  • 修复扩容时 Routine Load 不能使用新扩容 BE 的问题。

权限管理

  • 修复使用 Ranger 作为鉴权插件时,频繁访问 Ranger 服务的问题#45645

Others

  • 修复 BE 端开启 enable_jvm_monitor=true 后可能导致的内存泄露问题。[#44311](
相关文章
|
10天前
|
存储 运维 监控
金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
中信银行信用卡中心每日新增日志数据 140 亿条(80TB),全量归档日志量超 40PB,早期基于 Elasticsearch 构建的日志云平台,面临存储成本高、实时写入性能差、文本检索慢以及日志分析能力不足等问题。因此使用 Apache Doris 替换 Elasticsearch,实现资源投入降低 50%、查询速度提升 2~4 倍,同时显著提高了运维效率。
金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
|
1月前
|
存储 SQL Apache
Apache Doris 创始人:何为“现代化”的数据仓库?
3.0 版本是 Apache Doris 研发路程中的重要里程碑,他将这一进展总结为“实时之路”、“统一之路”和“弹性之路”,详细介绍了所对应的核心特性的设计思考与应用价值,揭晓了 2025 年社区发展蓝图
Apache Doris 创始人:何为“现代化”的数据仓库?
|
1月前
|
SQL 存储 数据处理
别让你的CPU打盹儿:Apache Doris并行执行原理大揭秘!
别让你的CPU打盹儿:Apache Doris并行执行原理大揭秘!
91 1
别让你的CPU打盹儿:Apache Doris并行执行原理大揭秘!
|
27天前
|
存储 SQL 监控
计算效率提升 10 倍,存储成本降低 60%,灵犀科技基于 Apache Doris 建设统一数据服务平台
灵犀科技早期基于 Hadoop 构建大数据平台,在战略调整和需求的持续扩增下,数据处理效率、查询性能、资源成本问题随之出现。为此,引入 [Apache Doris](https://doris.apache.org/) 替换了复杂技术栈,升级为集存储、加工、服务为一体的统一架构,实现存储成本下降 60%,计算效率提升超 10 倍的显著成效。
计算效率提升 10 倍,存储成本降低 60%,灵犀科技基于 Apache Doris 建设统一数据服务平台
|
2月前
|
存储 消息中间件 分布式计算
Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践
Cisco WebEx 早期数据平台采用了多系统架构(包括 Trino、Pinot、Iceberg 、 Kyuubi 等),面临架构复杂、数据冗余存储、运维困难、资源利用率低、数据时效性差等问题。因此,引入 Apache Doris 替换了 Trino、Pinot 、 Iceberg 及 Kyuubi 技术栈,依赖于 Doris 的实时数据湖能力及高性能 OLAP 分析能力,统一数据湖仓及查询分析引擎,显著提升了查询性能及系统稳定性,同时实现资源成本降低 30%。
Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践
|
1月前
|
SQL 存储 Apache
Apache Doris 3.0.3 版本正式发布
亲爱的社区小伙伴们,Apache Doris 3.0.3 版本已于 2024 年 12 月 02 日正式发布。该版本进一步提升了系统的性能及稳定性,欢迎大家下载体验。
|
2月前
|
Dubbo 安全 应用服务中间件
Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议,弱网效率提升 6 倍
在 Apache Dubbo 3.3.0 版本之后,官方推出了全新升级的 Triple X 协议,全面支持 HTTP/1、HTTP/2 和 HTTP/3 协议。本文将围绕 Triple 协议对 HTTP/3 的支持进行详细阐述,包括其设计目标、实际应用案例、性能测试结果以及源码架构分析等内容。
|
2月前
|
SQL 存储 数据处理
兼顾高性能与低成本,浅析 Apache Doris 异步物化视图原理及典型场景
Apache Doris 物化视图进行了支持。**早期版本中,Doris 支持同步物化视图;从 2.1 版本开始,正式引入异步物化视图,[并在 3.0 版本中完善了这一功能](https://www.selectdb.com/blog/1058)。**
|
2月前
|
SQL 存储 Java
Apache Doris 2.1.7 版本正式发布
亲爱的社区小伙伴们,**Apache Doris 2.1.7 版本已于 2024 年 11 月 10 日正式发布。**2.1.7 版本持续升级改进,同时在湖仓一体、异步物化视图、半结构化数据管理、查询优化器、执行引擎、存储管理、以及权限管理等方面完成了若干修复。欢迎大家下载使用。
|
1月前
|
存储 人工智能 大数据
The Past, Present and Future of Apache Flink
本文整理自阿里云开源大数据负责人王峰(莫问)在 Flink Forward Asia 2024 上海站主论坛开场的分享,今年正值 Flink 开源项目诞生的第 10 周年,借此时机,王峰回顾了 Flink 在过去 10 年的发展历程以及 Flink社区当前最新的技术成果,最后展望下一个十年 Flink 路向何方。
363 33
The Past, Present and Future of Apache Flink

热门文章

最新文章

推荐镜像

更多