智能语音交互的搜索结果_热门_第5页-阿里云开发者社区

V897857410

|

博文

本文介绍了如何从零开始搭建一个语音对话机器人，涵盖自动语音识别（ASR）、自然语言处理（NLP）和文本到语音合成（TTS）三大核心模块。通过使用开源工具如FunASR、LLaMA3-8B和ChatTTS，以及FastAPI和Gradio等技术，详细指导读者轻松实现个人AI小助手的构建，适合技术新手快速上手。

# 智能对话机器人 # GPU云服务器 # 智能语音交互 # 智能语音交互 # 人工智能 # 自然语言处理 # 机器人 # API # 语音技术

TsingtaoAI

|

博文

一套基本的具身智能技术流程是如何实现的

Embodied Intelligence作为一种将感知、决策与执行相结合的前沿技术，正在引领机器人技术迈向新的高度。具身智能不仅要求机器人具备理解和处理复杂环境的能力，还需赋予其自主决策和执行任务的能力。本文将深入探讨如何将LLM和多模态大模型与机器人技术相结合，构建一套完整的具身智能技术流程。本文参考了同济子豪兄的部分工作，TsingtaoAI团队对整体构建做了一部分拓展和延伸。

# 云消息队列 Kafka 版 # 云解析DNS # 云数据库 MongoDB 版 # 自然语言处理 # 智能语音交互 # 可观测监控 Prometheus 版 # 传感器 # 消息中间件 # 人工智能 # 机器人 # 数据处理

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

Dolphin是清华大学与海天瑞声联合研发的语音识别大模型，支持40种东方语言和22种中文方言，采用CTC-Attention混合架构，词错率显著低于同类模型。

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术 # Python

蚝油菜花

|

12月前

|

博文

|

来自： ModelScope模型即服务

CosyVoice 2.0：阿里开源升级版语音生成大模型，支持多语言和跨语言语音合成，提升发音和音色等的准确性

CosyVoice 2.0 是阿里巴巴通义实验室推出的语音生成大模型升级版，通过有限标量量化技术和块感知因果流匹配模型，显著提升了发音准确性、音色一致性和音质，支持多语言和流式推理，适合实时语音合成场景。

# 智能语音交互 # 人工智能 # 自然语言处理 # 人机交互 # 语音技术

喜欢猪猪

|

博文

Spring Boot 接入大模型实战：通义千问赋能智能应用快速构建

【10月更文挑战第23天】在人工智能（AI）技术飞速发展的今天，大模型如通义千问（阿里云推出的生成式对话引擎）等已成为推动智能应用创新的重要力量。然而，对于许多开发者而言，如何高效、便捷地接入这些大模型并构建出功能丰富的智能应用仍是一个挑战。

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 自然语言处理 # Java # API # 语音技术 # Spring

ShaFaChuang-36210

|

博文

智能语音交互：技术原理与应用前景####

【10月更文挑战第25天】一句话概括本文主旨，并引发读者兴趣。智能语音交互技术，作为人工智能领域的重要分支，正以前所未有的速度融入我们的生活，从简单的语音助手到复杂的多轮对话系统，它不仅重塑了人机交互的方式，还为多个行业带来了革命性的变化。本文将深入浅出地探讨智能语音交互的技术原理、当前主流技术路线、面临的挑战及未来发展趋势，为读者揭开这一高科技领域的神秘面纱。 ####

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 搜索推荐 # 算法 # 语音技术

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

百聆：集成Deepseek API及语音技术的开源AI语音对话助手，实时交互延迟低至800ms

百聆是一款开源的AI语音对话助手，结合ASR、VAD、LLM和TTS技术，提供低延迟、高质量的语音对话体验，适用于边缘设备和低资源环境。

# 智能语音交互 # 人工智能 # 自然语言处理 # API # 语音技术 # 智能硬件

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

EmotiVoice：网易开源AI语音合成黑科技，2000+音色情感可控

EmotiVoice是网易有道开源的多语言语音合成系统，支持中英文2000多种音色，通过提示词控制情感输出，提供Web界面和API接口，具备语音克隆等先进功能。

# 智能语音交互 # 人工智能 # API # 语音技术 # Docker # 容器

34789737

|

4月前

|

博文

免费版的配音软件，支持童声男声女声不同声音选项，语音转文字软件推荐支持多种声音

# 智能语音交互 # 智能语音交互 # 人工智能 # API # 语音技术

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

FireRedASR：精准识别普通话、方言和歌曲歌词！小红书开源工业级自动语音识别模型

小红书开源的工业级自动语音识别模型，支持普通话、中文方言和英语，采用 Encoder-Adapter-LLM 和 AED 架构，实现 SOTA 性能。

# 智能语音交互 # 智能语音交互 # 人工智能 # 物联网 # 测试技术 # 语音技术 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

智能语音交互