Apache Doris 4.0.2 版本正式发布

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 亲爱的社区小伙伴们,Apache Doris 4.0.2 版本已正式发布。此版本新增了在 AI & Search、函数、物化视图、Lakehouse 等方面的功能,并同步进行了多项优化改进及问题修复,欢迎下载体验!

亲爱的社区小伙伴们,Apache Doris 4.0.2 版本已正式发布。此版本新增了在 AI & Search、函数、物化视图、Lakehouse 等方面的功能,并同步进行了多项优化改进及问题修复,欢迎下载体验!

新增功能

AI & Search

  • 倒排索引支持自定义分析器,包含拼音分词器和拼音过滤器
  • 倒排索引的搜索函数新增多位置短语查询(PhraseQuery)支持
  • 新增 ANN 索引仅扫描能力

函数

  • 新增 sem 聚合函数
  • 支持源自 Hive 的 factorial简单 SQL 函数
  • 部分正则表达式函数新增零宽断言支持
  • JSON 类型支持 GROUP BY 和 DISTINCT 操作
  • 新增 add/sub_time 时间函数
  • 新增 deduplicate_map 函数

物化视图

  • 非分区基表数据变更时,物化视图仍可参与透明查询重写
  • 创建 MTMV 支持基于视图创建
  • MTMV 刷新支持多 PCT 表
  • 物化视图包含窗口函数时,支持窗口函数重写

Lakehouse

优化改进

  • 优化 FROM_UNIXTIME 函数性能
  • 移除 PartitionKey 比较中的 castTo转换操作,提升分区处理效率
  • 降低 Catalog 中 Column 类的内存占用
  • Ann 索引训练前累积多个小批次数据,提升训练效率
  • 升级 Hadoop 依赖到 3.4.2 版本
  • 优化 FE 和 BE 的优雅退出机制,降低节点退出对查询的影响
  • 优化对包含大量分区的 hive 表的写入的效率
  • 优化 Paimon 表 Split 占用内存过大的问题
  • 优化对 Parquet RLE_DICTIONARY 编码的读取效率
  • 优化 FE 和 BE 的优雅退出机制,降低节点退出对查询的影响

问题修复

查询

  • 修复输入为 null 时 utc_time 函数返回结果错误的问题
  • 修复 UNION ALL 结合 TVF 时抛出异常的问题
  • 修复唯一键表创建物化视图时,WHERE 子句包含非键列的问题
  • 修复 window 函数:LAG/LEAD 偏移参数支持常量表达式计算
  • 修复聚合函数:可空列投影前下推聚合操作异常;非空列 count 下推聚合问题
  • 修复时间函数:second/microsecond 函数未处理时间字面量;time_to_sec 处理 null 值时因垃圾值报错
  • 修复 AI 函数:_exec_plan_fragment_impl 调用 AI 函数时出现未知错误
  • 修复地理信息:geo 模块内存泄漏
  • 修复 information_schema:偏移时区格式不兼容

物化视图与模式变更

  • 修复物化视图包含分组集合和扫描过滤器时重写失败的问题
  • 修复大流量模式变更时读取单行集非重叠段导致的 coredump 问题

存算分离

  • 修复 TopN 查询中广播远程读取的问题
  • 修复云环境下删除 tablet 任务堆积的问题
  • 修复云环境首次启动时服务上线耗时过长的问题

Lakehouse

  • 修复某些情况下,Hive 分区变更导致元数据缓存不一致的问题
  • 修复写入 TIMESTAMP 类型分区的 Iceberg 表错误的问题
  • 修复 Paimon 表 Incremental Read 行为和 Spark 不一致的问题
  • 修复某些情况下,外表元数据缓存可能导致的死锁问题
  • 修复 BE 端 s3 client 线程数不合理导致的 IO 吞吐低的问题
  • 修复某些情况,写入存储在非 S3 对象存储上的外表时失败的问题
  • 修复某些情况下,使用 query() 进行 JDBC Catalog SQL 透传失败的问题
  • 修复 JNI Reader 时间统计导致读取性能下降的问题
  • 修复 BE 侧 jni.log 无法打印的问题

其他

  • 修复在非 Master 阶段 UNSET GLOBAL 变量时错误的问题
  • 修复某些情况下,异常的 export 任务无法取消的问题
目录
相关文章
|
6天前
|
存储 JavaScript 前端开发
JavaScript基础
本节讲解JavaScript基础核心知识:涵盖值类型与引用类型区别、typeof检测类型及局限性、===与==差异及应用场景、内置函数与对象、原型链五规则、属性查找机制、instanceof原理,以及this指向和箭头函数中this的绑定时机。重点突出类型判断、原型继承与this机制,助力深入理解JS面向对象机制。(238字)
|
5天前
|
云安全 人工智能 安全
阿里云2026云上安全健康体检正式开启
新年启程,来为云上环境做一次“深度体检”
1609 6
|
7天前
|
安全 数据可视化 网络安全
安全无小事|阿里云先知众测,为企业筑牢防线
专为企业打造的漏洞信息收集平台
1333 2
|
1天前
|
消息中间件 人工智能 Kubernetes
阿里云云原生应用平台岗位急招,加入我们,打造 AI 最强基础设施
云原生应用平台作为中国最大云计算公司的基石,现全面转向 AI,打造 AI 时代最强基础设施。寻找热爱技术、具备工程极致追求的架构师、极客与算法专家,共同重构计算、定义未来。杭州、北京、深圳、上海热招中,让我们一起在云端,重构 AI 的未来。
|
6天前
|
缓存 算法 关系型数据库
深入浅出分布式 ID 生成方案:从原理到业界主流实现
本文深入探讨分布式ID的生成原理与主流解决方案,解析百度UidGenerator、滴滴TinyID及美团Leaf的核心设计,涵盖Snowflake算法、号段模式与双Buffer优化,助你掌握高并发下全局唯一ID的实现精髓。
359 160
|
6天前
|
人工智能 自然语言处理 API
n8n:流程自动化、智能化利器
流程自动化助你在重复的业务流程中节省时间,可通过自然语言直接创建工作流啦。
438 6
n8n:流程自动化、智能化利器
|
8天前
|
人工智能 API 开发工具
Skills比MCP更重要?更省钱的多!Python大佬这观点老金测了一周终于懂了
加我进AI学习群,公众号右下角“联系方式”。文末有老金开源知识库·全免费。本文详解Claude Skills为何比MCP更轻量高效:极简配置、按需加载、省90% token,适合多数场景。MCP仍适用于复杂集成,但日常任务首选Skills。推荐先用SKILL.md解决,再考虑协议。附实测对比与配置建议,助你提升效率,节省精力。关注老金,一起玩转AI工具。
|
15天前
|
机器学习/深度学习 安全 API
MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!
MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型,原生集成用户交互、MCP工具调用与端云协同能力。支持跨App操作、模糊语义理解与主动提问澄清,通过大规模在线强化学习实现复杂任务自动化,在出行、办公等高频场景中表现卓越,已登顶ScreenSpot-Pro、MobileWorld等多项SOTA评测。
1594 7
|
5天前
|
Linux 数据库
Linux 环境 Polardb-X 数据库 单机版 rpm 包 安装教程
本文介绍在CentOS 7.9环境下安装PolarDB-X单机版数据库的完整流程,涵盖系统环境准备、本地Yum源配置、RPM包安装、用户与目录初始化、依赖库解决、数据库启动及客户端连接等步骤,助您快速部署运行PolarDB-X。
262 1
Linux 环境 Polardb-X 数据库 单机版 rpm 包 安装教程
|
10天前
|
人工智能 前端开发 API
Google发布50页AI Agent白皮书,老金帮你提炼10个核心要点
老金分享Google最新AI Agent指南:让AI从“动嘴”到“动手”。Agent=大脑(模型)+手(工具)+协调系统,可自主完成任务。通过ReAct模式、多Agent协作与RAG等技术,实现真正自动化。入门推荐LangChain,文末附开源知识库链接。
717 119