AI 网关这一年,成了 AI 进化的缩影

简介: 未来,让每一个想用 AI 的企业,都能稳稳地迈出第一步。

(一)

回顾即将过去的2025年

是 Qwen、DeepSeek 等国产大模型

迈过拐点的一年


模型以外的工程技术

也正以波澜壮阔之势

加速演进和落地

1767750818206_80058a2d8aaf471291a30654964959bc.png

我们做的 AI 网关

从一个听起来有点新的概念

变成了很多客户落地 AI 时

离不开的基础设施

1767750832308_22cf5b7a109d46fab145ae6cca1973b1.png

(二)

记得年初 DeepSeek R1 发布

我们连夜拉会

帮助企业快速

从 OpenAI 切换到国产大模型上

1767750849098_a2a34cec79d04cb4b50d068f0f168a48.png

若干天后,Qwen2.5-Max 发布

我们再次快速响应

不是为了抢热点

而是让那些敢于冲的 AI 企业知道

我们在和他们并肩前行

1767751150521_25cb272b77ad4e5295635cb7377543cb.png


(三)

那会儿我们也在想

光支持模型切换还不够

大模型要真正有用

得能联网、能控权限

能防滥用、能观测效果等


于是我们以插件方式

在业内率先支持联网搜索

帮助大模型获取搜索全文

1767751167603_307e5195ebde4f39a0368ba827b450c1.png

把自己服务早期客户的实战经验

一条条梳理出来

总结出

AI 网关的八大典型场景


说实话

当时并没想到

这会成为行业里

第一份完整的 AI 网关能力图谱

1767751182605_315202bb40844c848b7c10241b4a631d.png

但对我们来说

它就是一张用户痛点地图

每一块都是真实业务里打磨出来的


(四)

我们在开源的路上

持续扩展 AI 网关的能力范畴


例如开放了

专为大模型优化的负载均衡算法

首 Token 延迟直接砍掉50%

0b1ed0a313539cbc77a1715634a69b7d.png

(五)

开源了子项目 HiMarket

基于阿里巴巴内部的

AI 开放平台 IdeaLAB

1767755741130_6edbffe606bd4fafba18d182f89c574b.png

让每一家企业都能拥有

一个专属的

模型、应用和接口的统一管理平台

既方便架构师和运维同学

也方便了

程序员、运营、设计师等

AI 工具的使用者


再加上 AgentScope、AgentRun

就是比较完整的 AI 开发工具链了

1767755751704_ee62864bd8344b2db4d0a2eef3db8422.png

(六)

MCP 爆火那一阵

很多人被存量 API 转 MCP 这事难住了

我们把低代码的转换工具开源了出来

还搭建了一个 MCP 市场

帮助开发者

快速接入 50 多个高质量 MCP

c74966fff6ea88353d3249a349574f9e.png

(七)

一个多月后

Higress 入选

MCPMarket MCP Server

全球 Top 100 排行榜

1767755785407_fb957a84aeea4cc6b040949bad0aa2cf.png


主流的 Agent 开源客户端

都开始接入 Higress


阿里的淘天业务也通过 Higress

把内部 HSF 服务

快速转成 MCP Server

1767755797591_c5f4c0b86a1347a28e9f1743080de72a.png

这是继

通义千问、百炼、PAI、高德、饿了么后

再一次被集团客户使用


(八)

这一年

我们也服务了很多外部客户


携程旅游在中国可信云大会分享

他们是如何通过

Higress 解决大模型上线的真实难题

成为众多客户落地 AI 网关的

参考样例

1767755807966_5f440265c6ee4ccfae314d607fb96739.png

蚂蚁数科 SOFA 团队

基于 Higress 发布了 SOFA Higress

看到自己的开源项目

被金融级的客户深度采用

是我们持续引领 AI 网关的强心剂

1767755819140_45231d4fbe0542a1aaf566bbd49946b5.png

还有我们的天使用户 Sealos

在 Reddit 分享

他们从 Nginx Ingress 迁移到 Higress 的经历

以及性能提升近百倍的完整历程

引发国外开发者的好评

Higress,正在被世界看见

1767755831206_636439ab14e74153876f029a9c9486e8.png

(九)

除了服务企业客户

我们始终重视开发者关系

通过多样化的方式和开发者进行互动

比如参与了

KubeCon、浙大太乙平台、中科院开源之夏

1767755840877_05b849d8b65b40e8bf187934a156e0aa.png

我们还在开放原子基金会的支持下

举办了首届 Higress AI 网关开发者挑战赛

11 支队伍进入决赛

围绕 AI Agent、RAG、智能路比拼技术和创意

c3ab73e85a6ac3d6a6e28c9f1776c70a.png

(十)

但并不是每一个开源项目发展都会非常顺利

11月,我们看到一则非常遗憾的消息

Ingress NGINX 宣布退役

1767755870700_603cfe895e4d4ec1a2d8994fbd38a354.png

K8s 社区把 Higress 等开源项目

及其云产品

列为官方推荐的替代方案

1767755880143_b628053b5af84a92b880c5a0244f733c.png

欣慰之余,我们也在反思

开源无法只靠热情来发电

必须有可持续的商业支撑

才能走得更远


(十一)

我们上线

Higress 企业版的 Serverless 实例

不到十分之一的资源成本

就能搭起一套高可用的 AI 网关

1baa26201ad5eb9354b970657ce4e747.png

有客户跟我们说

原来 AI 工程化

真的可以这么简单

例如森马

就通过 Higress 企业版

实现了多模型、多 MCP 的统一管理

cd50d74c2daeb40a8f58455167a0eaff.png

整体效率提升 30%

快速成为行业里的 AI 落地标杆


(十二)

荣誉来自于积累

在乌镇世界互联网大会获得

开源优秀社区奖

社区贡献者邢国富获得

最具价值贡献者奖

1767755921877_8bc42fc867d4417ca29e2a167e01943e.png

AI 网关基于飞天企业版

在 AI 云产业发展大会上获得

三大创新实践奖项之一


还有 InfoQ 的年度 AI 开源项目


参与起草信通院牵头制定的

AI 网关行业标准


携程、国泰财产保险、君润数智

三家客户案例,入选最佳实践

1767755931904_3e53a5f2dc204597bce93a70bb68d4b2.png


(十三)

这些来自业内的认可

都会是珍贵的记忆

回头看这一年

没有哪个月是轻松的

但每一步都踩在了实处

写代码、做开源、扛需求、跑客户

我们始终相信

开源

是我们对行业的承诺

商业

是我们对长期主义的负责

1767755952558_253f534411e34ee69820a1c0510d3a9a.png

未来

让每一个想用 AI 的企业

都能稳稳地迈出第一步

👣

👣


漫画视频制作教程:👨‍🏫 自制漫画视频|详细教程 ✍️

相关文章
|
1天前
|
存储 人工智能 安全
AI 智能体开发的标准化流程
AI智能体开发已进入闭环治理新阶段,涵盖需求拆解、架构设计、工作流编排到多智能体协同。从角色定义到持续迭代,强调“小步快跑、低代码先行”,助力企业高效落地AI应用。#AI智能体 #AI应用 #软件外包公司
|
21天前
|
机器学习/深度学习 缓存 物联网
打造社交APP人物动漫化:通义万相wan2.x训练优化指南
本项目基于通义万相AIGC模型,为社交APP打造“真人变身跳舞动漫仙女”特效视频生成功能。通过LoRA微调与全量训练结合,并引入Sage Attention、TeaCache、xDIT并行等优化技术,实现高质量、高效率的动漫风格视频生成,兼顾视觉效果与落地成本,最终优选性价比最高的wan2.1 lora模型用于生产部署。(239字)
812 102
|
2天前
|
存储 人工智能 搜索推荐
AI Agent 记忆系统:从短期到长期的技术架构与实践
当智能体需要处理越来越复杂的任务和更长的对话历史,核心挑战是什么,又该如何突破。
|
16天前
|
机器学习/深度学习 人工智能 安全
2025 智能体工程现状
全面分析 AI 智能体在企业中的采用现状、挑战与趋势。
160 12
|
5天前
|
人工智能 前端开发 API
Google发布50页AI Agent白皮书,老金帮你提炼10个核心要点
老金分享Google最新AI Agent指南:让AI从“动嘴”到“动手”。Agent=大脑(模型)+手(工具)+协调系统,可自主完成任务。通过ReAct模式、多Agent协作与RAG等技术,实现真正自动化。入门推荐LangChain,文末附开源知识库链接。
520 119
|
10天前
|
存储 消息中间件 Apache
ZooKeeper 实战指南:从入门到场景解析
Apache ZooKeeper是分布式系统的协调核心,本文带你快速搭建环境,掌握Znode操作与Watcher机制,深入理解其在分布式锁、配置管理、服务发现等场景的应用,并解析美团Leaf中的实践案例。
252 132
|
13天前
|
存储 人工智能 关系型数据库
告别数据库“膨胀”:Dify x SLS 构建高可用生产级 AI 架构
告别数据库“膨胀”!借助SLS打造高可用生产级的Dify日志场景,通过将工作流日志从PostgreSQL迁移至SLS,实现存储压力降低95%+、成本下降近10倍,并支持实时分析、监控告警与数据闭环,彻底解决高并发下的连接池打满、慢查询频发等痛点,助力AI应用高效稳定运行!
|
28天前
|
人工智能 自然语言处理 API
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸
一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。
1175 153
|
29天前
|
存储 SQL JSON
打通可观测性的“任督二脉”:实体与关系的终极融合
阿里云推出图查询能力,基于 graph-match、graph-call、Cypher 三重引擎,实现服务依赖、故障影响、权限链路的秒级可视化与自动化分析,让可观测从‘看板时代’迈向‘图谱时代’。
254 46
|
3天前
|
人工智能 安全 API
Nacos 安全护栏:MCP、Agent、配置全维防护,重塑 AI Registry 安全边界
Nacos安全新标杆:精细鉴权、无感灰度、全量审计!