阿里云大数据 AI 产品月刊-2026年1月

简介: 阿里云大数据& AI 产品技术月刊【2026年1月】,涵盖1月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

阿里云大数据& AI 产品技术月刊【2026年1月】,涵盖1月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。


一、产品功能发布

人工智能平台 PAI - KV Store全局上下文缓存发布

EAS部署LLM服务的过程中支持配置KV Store的全局上线文缓存,通过GPU→内存→Redis kv metadata的多级存储查询来提升kvcache命中率,提升LLM推理吞吐性能。


人工智能平台 PAI - PAI智能助手诊断二期:支持DLC任务、EAS服务诊断

PAI智能助手(小PAI)智能诊断能力升级 1.降低AI工程门槛 2.提升资源使用效率 3.保障业务连续性 4. 知识沉淀与复用。


人工智能平台 PAI - 推理服务资源诊断发布

EAS 针对多机多卡的分布式服务实例单元以及普通服务实例,提供资源配额(quota)和优先级排队的诊断能力,帮助客户快速定位资源相关问题。


人工智能平台 PAI - AutoML 开服通知

AutoML在新加坡正式开服。


人工智能平台 PAI - DLC联合训练发布模型保护策略功能

PAI DLC 支持模型提供方在平台设定策略参数显式声明是否允许基于该数据产出的联合模型被导出,实现“数据使用即授权、模型产出可管控”的端到端隐私与知识产权保护机制,兼顾协作效率与合规安全。


人工智能平台 PAI - DLC发布vcpu算力分级功能

PAI 在智算场景,支持将算力CPU按照vcpu性能分为高、中和低等级,训练任务按照负载特点选择不同性能等级的vcpu,实现计算差异化使用,从而提升整体计算性能,预计提升计算性能 10%~30%


云原生大数据计算服务 MaxCompute - MaxFrame新增Embedding等预设大模型推理接口

MaxFrame AI Function 新增提供translate(翻译)、extract(结构化抽取)、embedding(向量化) 等预设标准化任务接口,可直接调用大模型推理能力


云原生大数据计算服务 MaxCompute - MaxFrame 新增 DLF Paimon 读写支持

MaxFrame 新增对 MC External Project 管理的 DLF Paimon 表读写支持


实时数仓 Hologres - 全文检索支持IK、Ngram、拼音分词器

全文检索支持IK、Ngram、拼音分词器,更广泛应用于中文描述类文本、日志类文本、中文商品/人名拼音等检索场景


实时数仓 Hologres - 自适应Serverless计算能力增强

自适应Serverless计算能力增强,支持自动负载隔离,负载高时自动切流至Serverless Computing资源池,显著提升系统吞吐能力与稳定性


实时数仓 Hologres - 表结构变更(Rebuild)能力增强

Rebuild能力增强,表结构变更过程中的写入受影响时长缩短至 10 秒以内,执行期间表可以正常查询


开源大数据平台 E-MapReduce - 全托管Spark支持纳管文件目录

  • 新增支持纳管NAS文件目录,挂载纳管NAS文件目录后,用户可以在Notebook、数据开发任务中对纳管文件目录中的文件进行读写操作。
  • 单个工作空间新增支持纳管多个文件目录。
  • 纳管文件目录支持挂载至 Spark Executor,挂载后所有Executor可以以本地路径访问挂载文件。


开源大数据平台 E-MapReduce - 全托管Spark支持按量转包年包月

支持按照队列粒度按量转包年包月,灵活满足业务需求。


开源大数据平台 E-MapReduce - 全托管Spark支持数据目录

数据目录添加 DLF Catalog 后,原生支持使用Catalog下所有格式的表,如 Paimon Table 和 Iceberg Table。


检索分析服务 Elasticsearch版 - 乌兰察布行业合规云售卖发布

开放区域:华北6(乌兰察布行业合规云)。


检索分析服务 Elasticsearch版 - 国际站发布

墨西哥Region国际站发布。


智能开放搜索 OpenSearch - 行业算法版支持OBJECT和NESTED两种复合数据类

行业算法版支持OBJECT和NESTED两种复合数据类型,允许将多个字段组合在一起,形成嵌套结构。正确使用复合数据类型,能提升查询准确性,避免错误匹配,让复杂数据管理更高效。


智能开放搜索 OpenSearch - 新增人脸多模态向量模型与人脸主体识别模型

提供多模态向量和主体识别服务中的人脸检测与向量化模型,提升视频检索效果。


向量检索服务 Milvus 版 - 支持平滑数据迁移能力

一键支持从开源 Milvus 自建集群、Zilliz Cloud 以及阿里云 Milvus 实例(不同版本)平滑迁移至阿里云 Milvus。


向量检索服务 Milvus 版 - 支持同城多可用区容灾能力

支持在双可用区基础版和高可用版实例间构建同城容灾能力,显著提升整体服务的容灾等级和可靠性。


向量检索服务 Milvus 版 - 支持 OSS 数据加密能力

支持用户在新购时配置自定义 KMS 密钥对底层 OSS 数据进行加密存储,实现数据全链路加密保护。满足金融、政企等对数据安全与合规性的高级要求,降低敏感数据泄露风险。


向量检索服务 Milvus 版 - 购买页全新升级

简化创建流程并降低选型成本,带来更顺畅直观的采购与开通体验。


二、产品快讯

Agentic Search: AI驱动的下一代企业搜索

Agentic Search 是 OpenSearch 升级的企业 AI 搜索:以 Agent 将搜索、推理、规划与工具调用融合,形成“理解-规划-执行-反馈”闭环,从找文档进化为交付结果。提供对话/规划/自适应三模式,支持多模态解析、企业知识库 RAG、代码执行、联网搜索与爬虫等,并可输出 Markdown/HTML 报告,覆盖深度研究、智能客服与企业提效场景。


万字实战沉淀,阿里云Hologres首发《Serverless OLAP 技术白皮书》

传统 OLAP 因存算一体与静态规划,低谷期也需全量在线,资源利用率低、成本与运维压力大。Hologres 提出 Serverless OLAP “Down to Zero”:按需秒级弹性、闲时降至零、强隔离与免运维,只为实际算力付费;通过共享弹性资源池、自动路由与纯 Serverless 实例实现。


EMR AI 助手再升级:支持 Serverless StarRocks

EMR AI 助手公测新增支持 Serverless StarRocks,面向参数调优、慢查询治理与异常排查等高门槛运维场景,提供智能对话、异常诊断和优化建议三大能力,可自然语言查询实例/SQL 状态、定位 CPU/内存/磁盘/超时等问题并给出修复与索引分区物化视图及参数调优建议;已在多区域开放体验。


Data+AI全面升级,阿里云OpenLake解决方案重磅更新

阿里云 OpenLake 方案升级:DLF 3.0 商业化实现全模态数据统一管理(Paimon 托管并兼容 Iceberg 等),统一元数据支持 PAI、MaxCompute、Hologres、Flink、EMR、ES、Milvus 等多引擎协同,一份数据多处计算。推出流存储 Fluss 公测,打通湖流一体将数据新鲜度提升到秒级、成本降 10 倍;EMR Serverless StarRocks 读写 Paimon 提升 100%,EMR Serverless Spark 全面支持 Spark 4.0 强化全模态预处理。


三、最佳实践

面向Interleaved Thinking的大模型Agent蒸馏实践

阿里云 PAI 基于 ReAct 交错思维构建多轮轨迹数据,提出“行为克隆 + 教师纠错”蒸馏流程,在 EasyDistill 框架实现一键生成轨迹并训练轻量 Agent。评测显示小模型在数学推理、多跳问答与 Deep Search 等需工具调用任务上稳定性与成功率显著提升,7B/8B 可接近甚至超过更大模型表现。


阿里云携手模思智能构建一站式多模态数据处理平台

阿里云与模思智能基于 MaxCompute 构建一站式多模态数据处理平台,借助 MaxFrame 分布式引擎与 DataWorks 编排,实现音视频等非结构化数据在 OSS 上统一存储、Object Table 自动采集元数据并纳管,支持异构算力协同调度与稳定高并发处理。落地后峰值可扩展至数万核,资源利用率提升 30%+,预处理性能提升 100%,运维投入减少 50%。


AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中

AI 时代企业 80% 知识沉睡在非结构化数据中,数据熵导致 RAG/Agent 易出错。Hologres 推出 HSAP 2.0 将向量/全文检索与 OLAP 原生融合,借助内存+磁盘分层向量引擎、BM25 混合检索、Serverless 弹性与负载强隔离,提供统一数据平面,降低成本并提升检索与分析确定性。


漫画说:为什么你的“增量计算”越跑越慢?——90%的实时数仓团队都踩过的坑,藏在这几格漫画里

Hologres Dynamic Table 采用有状态增量:首次全量持久化聚合/Join 状态,后续仅合并变更,避免反复扫描历史表,刷新由分钟降到秒并降本;分区与 TTL 控制状态膨胀。


Hologres Dynamic Table在淘天价格力的业务实践

淘天价格力用 Hologres Dynamic Table 做数据圈选与近实时报表:基于增量刷新持久化状态,秒级建表并随底表变更更新;分钟级刷新将亿级底表时延从小时降至分钟,Serverless 保障资源隔离。


迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升

迅雷大数据平台原 Hadoop 集群面临性能瓶颈、弹性不足、运维复杂与成本浪费。迁移至阿里云 EMR Serverless Spark 后,实现按需伸缩与归档数据便捷解冻,Kyuubi 提升交互分析效率;TCO 下降,大作业提速约 1 小时,报表稳定 6 点前产出,夜间运维显著减少。


一套底座支撑多场景:高德地图基于 Paimon + StarRocks 轨迹服务实践

高德轨迹数据高实时高并发且需长期存储,按访问跨度做热/温/冷分层:热层 Redis+Lindorm 保障低时延;温冷层 Flink 写入 Paimon、StarRocks 外表查询。配合轨迹聚合、Polyline 压缩、分区裁剪与多集群隔离,在千亿级查询下兼顾性能与成本。


为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大

ES 7.x 默认只返回 “10000+” 命中数,是为启用 Lucene 的 Block-Max WAND 跳过低分数据块,优先拿到 Top N 结果以提升性能。强制 track_total_hits:true 会迫使遍历并计数所有匹配文档,导致 CPU、I/O 和延迟大幅上升;聚合、排序并取分等场景也会削弱该优化。建议在线搜索用默认/设上限,精确计数仅低频场景使用,可用聚合或近似计数替代。

相关文章
|
3月前
|
人工智能 分布式计算 DataWorks
阿里云大数据AI产品月刊-2025年12月
大数据& AI 产品技术月刊【2025年 12 月】,涵盖 12 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
人工智能 调度 知识图谱
2026 AI 元年:AI 正在从“辅助工具”变成“系统能力”
AI正从“辅助工具”跃升为嵌入业务系统的“原生能力”,2026年将成为关键拐点:它不再仅提升个人效率,而是持续感知、自主决策、闭环执行,重构系统运行逻辑。推理工程化、组织级记忆、执行闭环是三大基石。AI成为生产要素的标志,是系统能否“自己做事”。
267 0
2026 AI 元年:AI 正在从“辅助工具”变成“系统能力”
|
25天前
|
弹性计算 人工智能 安全
2026年阿里云开年焕新特惠:多款云服务器限时低价,免费试用最高享660元额度
2026年初,阿里云推出“开年焕新”限时活动:轻量服务器低至68元/年,ECS经济型99元/年,第9代企业实例享6.4折;每日秒杀、最高660元免费试用、建站套餐109元起,另赠安全防护与备份权益,助力个人开发者及企业低成本上云与AI创新。
412 1
|
2月前
|
安全 物联网 C++
技术抉择:微调还是 RAG?——以春节祝福生成为例
本文以春节祝福生成为例,剖析微调与RAG的本质差异:RAG解决“信息缺失”,微调重塑“表达偏好”。当任务重风格、重分寸、重一致性(如拜年话术),模型缺的不是知识,而是默认的得体表达——此时微调比RAG更直接、可控、高效。
414 165
|
4月前
|
安全 API UED
2026 年起 WhatsApp 消息计费将调整!企业必看!
WhatsApp 将于 2026 年 1 月起调整全球消息计费规则:法国、埃及的营销类消息价格大幅下调(降幅近40%),美加的验证与通知类消息也小幅降价;但印度 Marketing 消息价格上涨约10%。出海企业需根据区域成本变化,重新评估通信预算与触达策略,避免隐性成本累积。
890 0
|
26天前
|
人工智能 弹性计算 自然语言处理
阿里云“AI焕新季”重磅启动:千问领衔,企业上云享万亿Tokens扶持与多重优惠!
2026年阿里云“AI焕新季”启动!聚焦大模型应用与中小企业数字化,推出Qwen3.5、Qwen-Image、万相Wan2.6等全新模型,叠加万亿Tokens扶持、5亿算力补贴、9.9元起一键部署及场景化AI方案,以“怎么买都便宜”助力全民轻松入局AI时代。
899 4
|
1月前
|
人工智能 JSON 自然语言处理
阿里云百炼产品月刊【2026年2月】
阿里云百炼本月重磅升级:Coding Plan迎新优惠,首购低至2折,月包最低只需7.9元起;上架21款新模型(含Qwen3.5-Plus、MiniMax-M2.5等);新增MemOS记忆管理MCP及73个应用模板(智能诊股、流程图生成、VOC分析等);推出AI实训营新春活动,赢定制礼品与限量行李箱。
707 2
|
2月前
|
存储 人工智能 自然语言处理
拒绝群发感!我用LoRA“调教”出懂分寸的AI,把大模型人情世故拉满了
本文分享如何用LoRA微调+4-bit量化,将Qwen3-32B大模型压缩至单卡RTX 4090可运行,打造“懂人情、有分寸”的春节祝福AI秘书。通过关系感知数据构建与思维链禁用,让AI祝福从套路化走向个性化、有记忆点的真挚表达。
122 4
|
3月前
|
人工智能 监控 安全
智能体来了:2026 AI元年真正到来!
内容摘要:2026年被公认为“AI智能体(Agent)元年”,引发人工智能从“对话框工具”到“充当数字”的质变。本文深度解析智能体背后的底层逻辑,拆解其在个人职能与产业变革中的核心员工作用,并提供一套可落地的分身构建方案,助你抓住阶层的核心红利。
348 1
|
3月前
|
人工智能 API 开发工具
2026年 AI 大模型 LLM API 应用开发指南:从原理到工程实践
本文将带你从零开始深入了解LLM(大语言模型)API开发。我们将剥离复杂的数学原理,专注于工程实践,涵盖从核心概念(Token、Prompt、Temperature)到环境配置、API选择、以及构建真实对话应用的完整流程。如果你是正在寻求AI转型的开发者,或者希望快速将LLM能力集成到产品中的工程师,这篇文章将是你的最佳起点。
1310 3