Weebo：支持多语言和实时语音交流的开源 AI 聊天机器人，回复具备语调、情感的语音

2025-01-19 28

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Weebo 是一款基于 Whisper Small、Llama 3.2 和 Kokoro-82M 技术的 AI 语音聊天机器人，支持实时语音交互和多语言对话，适用于个人助理、娱乐互动和教育辅导等多种场景。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日分享大模型与 AI 领域的最新开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

正文（附运行示例）

weebo

Weebo 是一款实时语音聊天机器人，基于 Whisper Small、Llama 3.2 和 Kokoro-82M 技术驱动。它能够通过语音识别和生成技术，与用户进行自然流畅的对话，提供实时的语音交互体验。

Weebo 可以应用于多种场景，如个人助理、娱乐互动和教育辅导等。无论是查询信息、设置提醒，还是进行趣味对话，Weebo 都能为用户提供便捷的服务。

语音识别：Weebo 基于先进的语音识别技术，将用户的语音输入转换为文本。具体实现中，可以采用 Web Speech API 或 WebRTC 结合 Whisper 等技术。
语音生成：Weebo 使用 AI 语音生成技术，将文本转换为自然语音。基于深度学习模型，生成具有适当语调、节奏和情感表达的语音。

首先，下载 Kokoro-82M 的 TTS 模型：

wget https://github.com/thewh1teagle/kokoro-onnx/releases/download/model-files/kokoro-v0_19.onnx

然后，使用 Ollama 拉取 Llama 3.2 模型：

ollama pull llama3.2

在终端中运行以下命令启动 Weebo：

python main.py

程序启动后，Weebo 将开始监听语音输入。用户只需自然说话，稍作停顿后，Weebo 会通过语音合成技术进行回复。按下 Ctrl+C 即可停止程序。

🥦 微信公众号｜搜一搜：蚝油菜花 🥦