❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦
🚀 快速阅读
- 功能:支持语音到语音的实时交互,提供自然流畅的对话体验。
- 技术:基于 Whisper Small、Llama 3.2 和 Kokoro-82M 技术,实现语音识别与生成。
- 应用:适用于个人助理、娱乐互动和教育辅导等多种场景。
正文(附运行示例)
Weebo 是什么
Weebo 是一款实时语音聊天机器人,基于 Whisper Small、Llama 3.2 和 Kokoro-82M 技术驱动。它能够通过语音识别和生成技术,与用户进行自然流畅的对话,提供实时的语音交互体验。
Weebo 可以应用于多种场景,如个人助理、娱乐互动和教育辅导等。无论是查询信息、设置提醒,还是进行趣味对话,Weebo 都能为用户提供便捷的服务。
Weebo 的主要功能
- 语音到语音交互:用户可以通过语音与 Weebo 进行交流,无需手动输入文字,交互更加自然和便捷。
- 实时对话:能实时响应用户的语音指令和问题,提供即时的反馈和回答,像与真人对话一样。
- 多语言支持:支持多种语言,满足不同用户的需求。
Weebo 的技术原理
- 语音识别:Weebo 基于先进的语音识别技术,将用户的语音输入转换为文本。具体实现中,可以采用 Web Speech API 或 WebRTC 结合 Whisper 等技术。
- 语音生成:Weebo 使用 AI 语音生成技术,将文本转换为自然语音。基于深度学习模型,生成具有适当语调、节奏和情感表达的语音。
如何运行 Weebo
1. 下载所需模型
首先,下载 Kokoro-82M 的 TTS 模型:
wget https://github.com/thewh1teagle/kokoro-onnx/releases/download/model-files/kokoro-v0_19.onnx
然后,使用 Ollama 拉取 Llama 3.2 模型:
ollama pull llama3.2
2. 运行 Weebo
在终端中运行以下命令启动 Weebo:
python main.py
程序启动后,Weebo 将开始监听语音输入。用户只需自然说话,稍作停顿后,Weebo 会通过语音合成技术进行回复。按下 Ctrl+C
即可停止程序。
资源
- 项目官网:https://amanvir.com/weebo
- GitHub 仓库:https://github.com/amanvirparhar/weebo
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦