嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。👉免费订阅,与10万+技术人共享升级秘籍!
如果你经常写长邮件、记会议纪要、写代码注释,却越来越不想敲键盘,那语音输入 + AI 帮你整理文稿,真的能省掉一大截时间。 而这次这款叫 「蛐蛐(QuQu)」 的工具,主打就是:给中文用户的本地语音工作流——既替代 Wispr Flow,又不用交月费,还把隐私锁在你电脑里。
解决啥问题
它是一个 开源桌面应用,用本地语音识别模型 + 你配置的大语言模型,把你说的话实时转成文字,再自动帮你润色、改错、整理成更成型的内容。
它解决的核心问题是:让中文用户可以不用付订阅费,也不用把语音丢到云端,就能用上接近 Wispr Flow 体验的语音输入工作流——写文案、写代码、写邮件都能用。
功能亮点
核心功能
先说几个最硬核的点:
- 本地中文语音识别:内置阿里巴巴的 FunASR Paraformer 模型,在你电脑本地跑,不依赖云端,既听得懂中文互联网的各种梗,又不用担心语音被上传。
- 两段式引擎:ASR + LLM:先精准语音转文字,再交给大模型做智能优化,自动删掉“嗯、啊”这类口头禅,还能把你刚才说错又改口的话,直接变成一版干净结果。
- 支持国产大模型生态:只要是兼容 OpenAI API 的服务都能接,README 里点名支持通义千问、Kimi、智谱 AI 等,国内用户延迟和费用都更友好。
- 为开发者优化的语音输入:能正确识别
camelCase、snake_case等编程命名,还能通过自定义指令,让输出更贴合「写代码 / 写文档 / 回邮件」不同场景。
体验细节
再说几个用起来比较爽的小细节:
- 一键唤醒就能说:全局快捷键默认是 F2(可以根据自己习惯调),不管你当前在什么应用里,按一下就能开始说。
- 实时识别 + 自动粘贴:本地 FunASR 实时转写,等 AI 处理完文本,会自动粘贴到你当前光标所在位置,感觉像多了个“语音键盘”。
- 界面偏极客但清晰:技术栈是 React 19 + TypeScript + Tailwind + Electron,一眼就能看出信息分区:录音区、识别文本、优化结果、设置页,结构对程序员/独立开发者比较友好。
- 本地配置,少云端依赖:AI 模型配置(API Key、Base URL、模型名)都在设置页里,保存在本地,不需要额外注册它自己的账号。
进阶玩法
如果你是喜欢折腾的那种人 :
- 三种 Python 环境方案:支持用 uv 自动管理 Python(最省心)、用系统 Python + venv、或者用嵌入式 Python 环境做完全隔离,适合从“先玩玩”到“打包发给团队”各种场景。
- AI 指令高度可定制:因为本质上是“本地 ASR + 你自己的 LLM 后端”,指令可以玩得很花——比如「帮我整理成工作汇报要点」「按 Markdown 生成接口文档」「转成英文邮件草稿」这类都能通过 prompt 定制。
- 有官方微信群社区:README 里专门放了微信交流群二维码,可以直接拉你进群,向作者提问题、分享自己折腾出来的语音工作流。
总结
如果你是 重度中文写作 / 会议记录 / 程序员用户,又在意隐私、想摆脱 Wispr Flow 订阅费,非常值得现在就 clone 下来折腾;但如果你只是偶尔录个语音、又完全不想碰 Node.js 和 Python 环境,那这款工具目前上手门槛会有点高,可以先收藏名字等它后面有更傻瓜的安装包再说。
项目地址
https://github.com/yan5xu/ququ
你要是已经在用蛐蛐,也欢迎在评论区分享一下:你都给它配了哪些大模型 / 指令,语音工作流是怎么搭的?我可以挑几种玩法单独做一期对比。