Apache Doris 4.0.2 版本正式发布

简介: 亲爱的社区小伙伴们,Apache Doris 4.0.2 版本已正式发布。此版本新增了在 AI & Search、函数、物化视图、Lakehouse 等方面的功能,并同步进行了多项优化改进及问题修复,欢迎下载体验!

亲爱的社区小伙伴们,Apache Doris 4.0.2 版本已正式发布。此版本新增了在 AI & Search、函数、物化视图、Lakehouse 等方面的功能,并同步进行了多项优化改进及问题修复,欢迎下载体验!

新增功能

AI & Search

  • 倒排索引支持自定义分析器,包含拼音分词器和拼音过滤器
  • 倒排索引的搜索函数新增多位置短语查询(PhraseQuery)支持
  • 新增 ANN 索引仅扫描能力

函数

  • 新增 sem 聚合函数
  • 支持源自 Hive 的 factorial简单 SQL 函数
  • 部分正则表达式函数新增零宽断言支持
  • JSON 类型支持 GROUP BY 和 DISTINCT 操作
  • 新增 add/sub_time 时间函数
  • 新增 deduplicate_map 函数

物化视图

  • 非分区基表数据变更时,物化视图仍可参与透明查询重写
  • 创建 MTMV 支持基于视图创建
  • MTMV 刷新支持多 PCT 表
  • 物化视图包含窗口函数时,支持窗口函数重写

Lakehouse

优化改进

  • 优化 FROM_UNIXTIME 函数性能
  • 移除 PartitionKey 比较中的 castTo转换操作,提升分区处理效率
  • 降低 Catalog 中 Column 类的内存占用
  • Ann 索引训练前累积多个小批次数据,提升训练效率
  • 升级 Hadoop 依赖到 3.4.2 版本
  • 优化 FE 和 BE 的优雅退出机制,降低节点退出对查询的影响
  • 优化对包含大量分区的 hive 表的写入的效率
  • 优化 Paimon 表 Split 占用内存过大的问题
  • 优化对 Parquet RLE_DICTIONARY 编码的读取效率
  • 优化 FE 和 BE 的优雅退出机制,降低节点退出对查询的影响

问题修复

查询

  • 修复输入为 null 时 utc_time 函数返回结果错误的问题
  • 修复 UNION ALL 结合 TVF 时抛出异常的问题
  • 修复唯一键表创建物化视图时,WHERE 子句包含非键列的问题
  • 修复 window 函数:LAG/LEAD 偏移参数支持常量表达式计算
  • 修复聚合函数:可空列投影前下推聚合操作异常;非空列 count 下推聚合问题
  • 修复时间函数:second/microsecond 函数未处理时间字面量;time_to_sec 处理 null 值时因垃圾值报错
  • 修复 AI 函数:_exec_plan_fragment_impl 调用 AI 函数时出现未知错误
  • 修复地理信息:geo 模块内存泄漏
  • 修复 information_schema:偏移时区格式不兼容

物化视图与模式变更

  • 修复物化视图包含分组集合和扫描过滤器时重写失败的问题
  • 修复大流量模式变更时读取单行集非重叠段导致的 coredump 问题

存算分离

  • 修复 TopN 查询中广播远程读取的问题
  • 修复云环境下删除 tablet 任务堆积的问题
  • 修复云环境首次启动时服务上线耗时过长的问题

Lakehouse

  • 修复某些情况下,Hive 分区变更导致元数据缓存不一致的问题
  • 修复写入 TIMESTAMP 类型分区的 Iceberg 表错误的问题
  • 修复 Paimon 表 Incremental Read 行为和 Spark 不一致的问题
  • 修复某些情况下,外表元数据缓存可能导致的死锁问题
  • 修复 BE 端 s3 client 线程数不合理导致的 IO 吞吐低的问题
  • 修复某些情况,写入存储在非 S3 对象存储上的外表时失败的问题
  • 修复某些情况下,使用 query() 进行 JDBC Catalog SQL 透传失败的问题
  • 修复 JNI Reader 时间统计导致读取性能下降的问题
  • 修复 BE 侧 jni.log 无法打印的问题

其他

  • 修复在非 Master 阶段 UNSET GLOBAL 变量时错误的问题
  • 修复某些情况下,异常的 export 任务无法取消的问题
目录
相关文章
|
2天前
|
数据采集 人工智能 安全
|
11天前
|
云安全 监控 安全
|
3天前
|
自然语言处理 API
万相 Wan2.6 全新升级发布!人人都能当导演的时代来了
通义万相2.6全新升级,支持文生图、图生视频、文生视频,打造电影级创作体验。智能分镜、角色扮演、音画同步,让创意一键成片,大众也能轻松制作高质量短视频。
1008 151
|
3天前
|
编解码 人工智能 机器人
通义万相2.6,模型使用指南
智能分镜 | 多镜头叙事 | 支持15秒视频生成 | 高品质声音生成 | 多人稳定对话
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
1703 9
|
8天前
|
人工智能 自然语言处理 API
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸
一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。
646 152
|
10天前
|
人工智能 安全 前端开发
AgentScope Java v1.0 发布,让 Java 开发者轻松构建企业级 Agentic 应用
AgentScope 重磅发布 Java 版本,拥抱企业开发主流技术栈。
614 12
|
10天前
|
人工智能 自然语言处理 API
Next AI Draw.io:当AI遇见Draw.io图表绘制
Next AI Draw.io 是一款融合AI与图表绘制的开源工具,基于Next.js实现,支持自然语言生成架构图、流程图等专业图表。集成多款主流大模型,提供智能绘图、图像识别优化、版本管理等功能,部署简单,安全可控,助力技术文档与系统设计高效创作。
688 151