Wispr Flow 平替, 这款开源中文语音助手,程序员真该试试,本地离线的中文语音输入神器来了(开源白嫖版)

简介: 小华同学推荐开源神器「蛐蛐QuQu」:本地语音识别+AI润色,中文友好、隐私安全,免订阅费替代Wispr Flow。支持通义千问等国产模型,程序员专属语音工作流,写代码、记会议、回邮件效率翻倍!

嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。👉免费订阅,与10万+技术人共享升级秘籍!

                               

如果你经常写长邮件、记会议纪要、写代码注释,却越来越不想敲键盘,那语音输入 + AI 帮你整理文稿,真的能省掉一大截时间。 而这次这款叫 「蛐蛐(QuQu)」 的工具,主打就是:给中文用户的本地语音工作流——既替代 Wispr Flow,又不用交月费,还把隐私锁在你电脑里。

解决啥问题

它是一个 开源桌面应用,用本地语音识别模型 + 你配置的大语言模型,把你说的话实时转成文字,再自动帮你润色、改错、整理成更成型的内容。

它解决的核心问题是:让中文用户可以不用付订阅费,也不用把语音丢到云端,就能用上接近 Wispr Flow 体验的语音输入工作流——写文案、写代码、写邮件都能用。

功能亮点

核心功能

先说几个最硬核的点:

  • 本地中文语音识别:内置阿里巴巴的 FunASR Paraformer 模型,在你电脑本地跑,不依赖云端,既听得懂中文互联网的各种梗,又不用担心语音被上传。
  • 两段式引擎:ASR + LLM:先精准语音转文字,再交给大模型做智能优化,自动删掉“嗯、啊”这类口头禅,还能把你刚才说错又改口的话,直接变成一版干净结果。
  • 支持国产大模型生态:只要是兼容 OpenAI API 的服务都能接,README 里点名支持通义千问、Kimi、智谱 AI 等,国内用户延迟和费用都更友好。
  • 为开发者优化的语音输入:能正确识别 camelCasesnake_case 等编程命名,还能通过自定义指令,让输出更贴合「写代码 / 写文档 / 回邮件」不同场景。

体验细节

再说几个用起来比较爽的小细节:

  • 一键唤醒就能说:全局快捷键默认是 F2(可以根据自己习惯调),不管你当前在什么应用里,按一下就能开始说。
  • 实时识别 + 自动粘贴:本地 FunASR 实时转写,等 AI 处理完文本,会自动粘贴到你当前光标所在位置,感觉像多了个“语音键盘”。
  • 界面偏极客但清晰:技术栈是 React 19 + TypeScript + Tailwind + Electron,一眼就能看出信息分区:录音区、识别文本、优化结果、设置页,结构对程序员/独立开发者比较友好。
  • 本地配置,少云端依赖:AI 模型配置(API Key、Base URL、模型名)都在设置页里,保存在本地,不需要额外注册它自己的账号。

进阶玩法

如果你是喜欢折腾的那种人 :

  • 三种 Python 环境方案:支持用 uv 自动管理 Python(最省心)、用系统 Python + venv、或者用嵌入式 Python 环境做完全隔离,适合从“先玩玩”到“打包发给团队”各种场景。
  • AI 指令高度可定制:因为本质上是“本地 ASR + 你自己的 LLM 后端”,指令可以玩得很花——比如「帮我整理成工作汇报要点」「按 Markdown 生成接口文档」「转成英文邮件草稿」这类都能通过 prompt 定制。
  • 有官方微信群社区:README 里专门放了微信交流群二维码,可以直接拉你进群,向作者提问题、分享自己折腾出来的语音工作流。

总结

如果你是 重度中文写作 / 会议记录 / 程序员用户,又在意隐私、想摆脱 Wispr Flow 订阅费,非常值得现在就 clone 下来折腾;但如果你只是偶尔录个语音、又完全不想碰 Node.js 和 Python 环境,那这款工具目前上手门槛会有点高,可以先收藏名字等它后面有更傻瓜的安装包再说。

项目地址

https://github.com/yan5xu/ququ

你要是已经在用蛐蛐,也欢迎在评论区分享一下:你都给它配了哪些大模型 / 指令,语音工作流是怎么搭的?我可以挑几种玩法单独做一期对比。

相关文章
|
5天前
|
数据采集 人工智能 安全
|
15天前
|
云安全 监控 安全
|
1天前
|
存储 SQL 大数据
删库跑路?别慌!Time Travel 带你穿回昨天的数据世界
删库跑路?别慌!Time Travel 带你穿回昨天的数据世界
237 156
|
8天前
|
SQL 自然语言处理 调度
Agent Skills 的一次工程实践
**本文采用 Agent Skills 实现整体智能体**,开发框架采用 AgentScope,模型使用 **qwen3-max**。Agent Skills 是 Anthropic 新推出的一种有别于mcp server的一种开发方式,用于为 AI **引入可共享的专业技能**。经验封装到**可发现、可复用的能力单元**中,每个技能以文件夹形式存在,包含特定任务的指导性说明(SKILL.md 文件)、脚本代码和资源等 。大模型可以根据需要动态加载这些技能,从而扩展自身的功能。目前不少国内外的一些框架也开始支持此种的开发方式,详细介绍如下。
622 5
|
12天前
|
人工智能 自然语言处理 API
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸
一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。
782 152
|
20天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
1886 9
|
2天前
|
机器学习/深度学习 人工智能 监控
别把模型当宠物养:从 CI/CD 到 MLOps 的工程化“成人礼”
别把模型当宠物养:从 CI/CD 到 MLOps 的工程化“成人礼”
221 163