告别手动画图:用自然语言生成可直接发布的 SVG+PNG 技术图

简介: `fireworks-tech-graph`它把技术图这件事,从一次性手工劳动,变成了一种可以沉淀、复用、批量生成的 Skill 能力。在 AI/Agent 相关内容越来越多的背景下,这是一个很值得试一下的项目。

如果你经常写技术博客、做架构设计文档,或者需要快速出图,一定体会过这种纠结:脑子里有清晰的系统结构,但落到画图工具里就是另一回事了——要么在 draw.io 里拖拽半天,要么跟 Mermaid 的 DSL 语法较劲。

最近在 GitHub 上看到一个叫 fireworks-tech-graph 的项目,它是一个Skill,核心能力很简单:你用中文描述系统,它几秒钟生成可直接发布的 SVG + PNG 技术图

fireworks-tech-graph 概述

fireworks-tech-graph 将自然语言描述转化为精美的 SVG 技术图,并通过 cairosvg(推荐)导出高分辨率 PNG,同时支持 rsvg-convertpuppeteer 作为备选方案。内置 7 种模板风格 + 1 种 AI 手绘风格(Dark Luxury),深度覆盖 AI/Agent 领域常见图类型(RAG、Agentic Search、Mem0、Multi-Agent、Tool Call 流程等),并完整支持全部 14 种 UML 图类型。

github 地址:https://github.com/yizhiyanhua-ai/fireworks-tech-graph

该项目目前再github 上已有7.8k star

解决了什么问题?

很多人写技术文档时都会遇到一个很现实的问题:图很重要,但画图本身特别耗时间。

常见痛点包括:

  • 脑子里有结构,但落到图里很慢
  • Mermaid 适合快速表达,但视觉效果和复杂结构承载能力有限
  • draw.io 虽然强,但手工拖拽成本高,不适合频繁改稿
  • 当图要服务于 AI、Agent、RAG、Memory 这类新领域时,通用绘图工具缺少现成语义

fireworks-tech-graph 的价值在于:把“描述系统”直接转成“生成图”,而且不只是出 SVG,还能直接导出适合博客和文档嵌入的 PNG。

怎么用?

安装这个 Skill 只需要一行命令:

npx skills add yizhiyanhua-ai/fireworks-tech-graph

或者下载项目之后直接导入到你的AI 工具中

安装依赖

要导出 PNG,需要安装一个底层依赖。

  • npm 安装
# 最高保真:puppeteer(真实 Chromium,体积较大)
npm install puppeteer
  • pip 安装
# 推荐:cairosvg(CSS 支持最好)
pip install cairosvg

装完之后,直接在对话里用自然语言描述就行:

帮我话一张 github 开源项目https://github.com/yizhiyanhua-ai/fireworks-tech-graph     fireworks-tech-graph 工作流程图,使用中文,导出png

Skill 会自动识别图类型、选定风格、生成 SVG,然后导出 1920px 的高清 PNG。

不只是“自动画图”

这个项目有几个设计上的亮点,让它区别于普通的绘图工具。

8 种视觉风格

它内置了 8 套精心设计的样式,不是统一画风,而是能根据使用场景切换。

风格 特点 适用场景
扁平图标风 白底,彩色强调色 博客、技术文档
暗黑极客风 深色背景,霓虹配色 GitHub README、开发者文章
工程蓝图风 深蓝底,网格线,青色描边 架构设计文档
Notion 极简风 白底,单色箭头 Notion、Confluence Wiki
玻璃态卡片风 深色渐变,磨砂玻璃 产品官网、演讲 Keynote
Claude 官方风格 温暖奶油色背景 Anthropic 风格图表
OpenAI 官方风格 纯白背景,品牌配色 OpenAI 风格图表
暗黑奢华风 深黑背景,香槟金点缀 展示型架构图

14 种图类型 + 完整 UML 支持

这个 Skill 不是简单模板替换,它会先对用户描述做图类型归类,然后应用对应的布局规则。

支持的图类型包括:架构图、数据流图、流程图、Agent 架构图、Memory 架构图、时序图、对比矩阵、时间线、思维导图。



类型 描述 关键布局规则
架构图 服务、组件、云基础设施 水平分层,自上而下
数据流图 数据在系统中的流向 每条箭头标注数据类型
流程图 决策树、流程步骤 菱形 = 决策,自上而下
Agent 架构图 LLM + 工具 + 记忆 五层模型:输入/Agent/记忆/工具/输出
记忆架构图 Mem0、MemGPT 风格 读/写路径分离,记忆层级分明
序列图 API 调用链、时序交互 垂直生命线,水平消息箭头
对比图 功能矩阵、方案比较 列 = 系统,行 = 属性
思维导图 概念地图、发散思维 中心节点,贝塞尔曲线分支





完整的 14 种 UML 图(类图、组件图、部署图、包图、用例图、活动图、状态机图、序列图等)



UML 类型 描述 推荐风格
类图 类、属性、方法、关系 风格 1, 4
组件图 软件组件和依赖关系 风格 1, 3
部署图 硬件节点和软件部署 风格 3
包图 包组织和依赖关系 风格 1, 4
复合结构图 类/组件的内部结构 风格 1, 3
对象图 对象实例和关系 风格 1, 4
用例图 参与者、用例、系统边界 风格 1
活动图 工作流、并行流程 风格 3
状态机图 状态转换和事件 风格 2, 3
序列图 时间顺序的消息交换 风格 2
通信图 对象交互和消息 风格 1, 2
时序图 状态随时间的变化 风格 2
交互概览图 高层交互流程 风格 1, 2
ER 图 实体关系数据模型 风格 1, 3

AI/Agent 领域内建知识

对于 AI/Agent 相关场景,它内置了领域模式识别能力。RAG Pipeline、Agentic Search、Mem0 记忆架构、Multi-Agent 协作、Tool Call 流程这些常见 Pattern,不需要从零描述,直接说场景就能生成对应的领域图。

它还定义了一套语义形状词汇表:LLM 用双边框圆角矩形,Agent 用六边形,Vector Store 用带内环圆柱体;箭头颜色和虚线样式编码了写入、读取、异步、循环等语义。

输出与验证工具链

它提供了四个辅助脚本,让整个生成流程更稳定:

  • generate-diagram.sh:验证 SVG 并导出 PNG
  • generate-from-template.py:从模板快速创建起始 SVG
  • validate-svg.sh:单独校验 SVG 语法
  • test-all-styles.sh:批量测试所有风格

谁适合用?

  • 经常写技术博客、产品文档、方案文档的人
  • 经常需要画架构图、流程图、Agent 图,但不想每次都手动画的人
  • 做 AI / Agent / RAG / Memory 相关内容输出的人
  • 希望把“描述需求 → 生成图 → 嵌入文章”这条链路尽量标准化的人

写在最后

fireworks-tech-graph它把技术图这件事,从一次性手工劳动,变成了一种可以沉淀、复用、批量生成的 Skill 能力。在 AI/Agent 相关内容越来越多的背景下,这是一个很值得试一下的项目。

目录
相关文章
|
8天前
|
人工智能 弹性计算 开发者
2026年阿里云618年中大促全攻略:AI加速季,年度低价云服务器推荐指南
本文将为大家详细解读2026年阿里云618的活动亮点,精选值得入手的高性价比便宜云服务器,助力大家低成本上云!
233 6
|
8天前
|
SQL JSON 关系型数据库
企业级多模态分析计算引擎选型:阿里云 AnalyticDB MySQL 统一分析平台方案
阿里云AnalyticDB MySQL版是PB级云原生实时数据仓库,首创多模态统一分析引擎,单SQL原生支持SQL分析、向量检索、全文搜索与JSON分析,替代3–5套独立系统,综合成本降50%+,运维复杂度降80%,适用于AI+数据融合、多源异构统一查询等企业级场景。
169 17
企业级多模态分析计算引擎选型:阿里云 AnalyticDB MySQL 统一分析平台方案
|
1天前
|
人工智能 运维 Prometheus
从 API 到 AI Agent:阿里云云监控 CLI + Agent Skill 实战
阿里云推出云监控CLI与Agent Skill,将运维能力转化为AI可执行工作流。用户通过自然语言指令,即可由Agent自动完成资源接入、告警管理及数据查询等任务,实现可控、可审计的智能化运维自动化。
201 120
|
8天前
|
存储 人工智能 算法
告别无效刷屏!TrendRadar:最快30秒部署的开源热点助手,让你只看真正关心的新闻
TrendRadar 是一个轻量级、易部署的热点新闻聚合与推送工具。它能够从知乎、抖音、B站、微博、百度、华尔街见闻等11个主流平台抓取热搜榜单,然后根据你设定的关键词进行智能筛选,最终将你最关心的内容推送到手机或邮箱。
261 13
 告别无效刷屏!TrendRadar:最快30秒部署的开源热点助手,让你只看真正关心的新闻
|
8天前
|
IDE 网络安全 开发工具
【全网最详细】TortoiseGit安装汉化和配置保姆级教程(附安装包+汉化包)
TortoiseGit是Windows平台开源免费的Git图形化客户端,集成于资源管理器右键菜单,零命令操作。支持图标覆盖层直观显示文件状态,无需记忆git命令,兼容所有IDE,学习成本低,适合个人及团队版本管理。(239字)
|
2天前
|
人工智能 JSON API
AI Agent 完全入门:从“大模型”到“能干活”的智能体,一篇讲透
本文深入浅出解析AI Agent本质:非 merely 工具调用,而是“感知-规划-记忆-工具”四层闭环的行动系统。对比普通大模型“只生成答案”,Agent能自主拆解目标、多步执行任务。聚焦测试场景,详解其在自动生成数据、UI自愈、智能断言三大落地点的实效价值。
|
8天前
|
人工智能 自然语言处理 API
阿里云海外重磅发布 Qwen Cloud
Qwen Cloud,正是为AI Agent 而生的全新服务方式。
1326 47
|
1月前
|
缓存 监控 安全
别再让Docker占满你的硬盘!一篇搞定docker system所有命令
本指南详解 `docker system` 命令组,助你精准诊断与优雅清理 Docker 占用空间:`df` 查磁盘、`prune` 清资源、`info` 看配置、`events` 监事件。覆盖安全清理策略、自动化脚本与环境最佳实践,告别“磁盘爆满”焦虑。(239字)
240 2
别再让Docker占满你的硬盘!一篇搞定docker system所有命令
|
1月前
|
JSON JavaScript 前端开发
在TypeScript和JavaScript如何使用MetaMessage?
MetaMessage 是一种跨语言数据交换协议,支持 TypeScript/JavaScript(通过装饰器自动类型转换)、JSONC 文本与紧凑二进制 wire 格式,兼顾可读性、精度(如 bigint 表示 int64)与性能,旨在替代 JSON、Protobuf 等传统序列化方案。
224 125
|
8天前
|
人工智能 供应链 数据可视化
长江商学院CIO徐斌:AI时代,组织的进化逻辑与人才转型新思维
徐斌,长江商学院CIO、计算机博士,20年世界500强及上市公司高管经验,首创数字化“三驾马车”方法论(流程变革、IT固化、数字运营),成功主导得力集团全链路转型,助力其获评首批浙江省未来工厂。

热门文章

最新文章