备案控制台

开发者社区人工智能文章正文

活动实践 | AI智能体实时语音互动

2024-12-23 745

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： AI智能体实时语音互动方案提供端到端的实时音频交互，用户通过终端SDK与云端AI智能体进行音频通话。AI智能体接收音频输入，依据预定义工作流处理并生成响应，通过ARTC网络推送结果。该方案支持灵活编排AI组件如语音转文字、大语言模型等，确保高可用、低延迟的通信体验。用户可轻松创建和管理智能体及实时工作流，实现高效对话，并可通过示例网站体验功能。

AI智能体实时语音互动是一个端到端的解决方案，旨在为用户与AI智能体之间提供实时音频交互。用户通过终端SDK发起与云端AI智能体的音频通话请求，AI智能体接收到用户的音频输入后，依据预定义的工作流进行处理，生成相应的音频响应，并通过ARTC网络将响应结果推送给用户。用户可以订阅该音频流进行播放，从而实现与AI智能体的对话。

一、方案架构

AI智能体是本方案的核心组件之一，能够在云端模拟高度拟真的用户交互。用户可以根据需求自行创建智能体。通过灵活的插件式和拖拽式方式，用户可以编排各个AI组件，如语音转文字、大语言模型、语音合成和自研向量数据库等，从而实现AI智能体的实时工作流。实时音视频通信技术（ARTC）为用户与AI智能体之间的音频通话提供了高可用、高品质、超低延时的保障。

二、创建实时音视频通信应用

实时音视频 ARTC 是智能体和用户之间建立起实时音频通信的基础，实现AI实时互动需要准备一个ARTC应用，参照以下步骤开通并创建ARTC应用。

1、开通视频直播：计费方式选择按使用流量计费，点击右下角立即开通。

2、单击创建应用。

三、创建AI智能体

1、编排实时工作流

实时工作流是一种预先定义的流程模板，用于自动化处理ARTC音频流。支持创建语音通话并且预设了多种功能节点，包括语音转文字 (STT)、文字转语音 (TTS)、文生文大语言模型（LLM）等。平台提供了可直接选用的预置模板，同时，也支持根据需求创建自定义模板，让智能体自动按照预设好的流程工作。

1、登录智能媒体服务控制台，点击立即开通按钮。

2、登录AI实时互动-工作流管理，单击创建工作流模板。

2、创建智能体

AI智能体是在AI实时互动解决方案中定义的高仿真用户，用户可以根据自身需求创建智能体，并将其集成到自己的应用中，使其能够按照既定工作流程在实时音频环境中运行，从而实现实时音频交互功能。

1、登录AI实时互动-智能体管理，单击创建智能体。

四、部署应用

1、请点击应用模板链接打开我们提供的函数计算应用模板，填写配置。

2、应用部署完成后，可以在应用的环境详情中找到示例网站的访问域名，点击即可查看，确认示例网站已经部署成功。

使用https访问才能获取语音。

五、应用体验

1、单击拨打按钮，即可开始与智能体对话。

2、用户可以与智能体进行实时语音对话，页面上会同步展示当前对话的文字信息，以便用户查阅对话内容。

3、单击右上角，可以开启/关闭智能打断，以及选择切换音色。

4、进行对话。

六、清理资源

1、删除函数计算应用：

登录函数计算控制台，在左侧导航栏，单击应用。找到目标应用，单击右侧操作列的删除应用。

2、删除智能体：

登录智能媒体服务控制台，在智能生产制作 > AI实时互动 > 智能体管理页面，找到智能体并单击删除。

3、删除实时工作流模板：

登录智能媒体服务控制台，在智能生产制作 > AI实时互动>工作流管理页面，找到工作流模板并单击删除。

4、删除ARTC应用：

登录视频直播控制台，在直播+ >实时音视频 > 应用管理页面，找到ARTC应用并单击删除。

文章标签：

人工智能

Serverless

开发工具

语音技术

视频直播

关键词：

AI智能体

AI语音

实践AI

穿过生命散发芬芳

目录

相关文章

阿里云开发者

|

2月前

|

人工智能 IDE Java

AI Coding实践：CodeFuse + prompt 从系分到代码

在蚂蚁国际信贷业务系统建设过程中，技术团队始终面临双重考验：一方面需应对日益加速的需求迭代周期，满足严苛的代码质量规范与金融安全合规要求；另一方面，跨地域研发团队的协同效率与代码标准统一性，在传统开发模式下逐渐显现瓶颈。为突破效率制约、提升交付质量，我们积极探索人工智能辅助代码生成技术（AI Coding）的应用实践。本文基于蚂蚁国际信贷技术团队近期的实际项目经验，梳理AI辅助开发在金融级系统快速迭代场景中的实施要点并分享阶段性实践心得。

阿里云开发者

483 25 27

AI Coding实践：CodeFuse + prompt 从系分到代码

灵杰开发者

|

2月前

|

人工智能数据处理 API

阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新，共筑基于 Apache Flink Agents 的智能体 AI 未来

Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目，旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架，实现数据与智能的实时融合。

灵杰开发者

413 6 6

阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新，共筑基于 Apache Flink Agents 的智能体 AI 未来

阿里云开发者

|

2月前

|

人工智能自然语言处理测试技术

从人工到AI驱动：天猫测试全流程自动化变革实践

天猫技术质量团队探索AI在测试全流程的落地应用，覆盖需求解析、用例生成、数据构造、执行验证等核心环节。通过AI+自然语言驱动，实现测试自动化、可溯化与可管理化，在用例生成、数据构造和执行校验中显著提效，推动测试体系从人工迈向AI全流程自动化，提升效率40%以上，用例覆盖超70%，并构建行业级知识资产沉淀平台。

阿里云开发者

630 0 2

从人工到AI驱动：天猫测试全流程自动化变革实践

AI未闻花名

|

2月前

|

人工智能测试技术 API

构建AI智能体：二、DeepSeek的Ollama部署FastAPI封装调用

本文介绍如何通过Ollama本地部署DeepSeek大模型，结合FastAPI实现API接口调用。涵盖Ollama安装、路径迁移、模型下载运行及REST API封装全过程，助力快速构建可扩展的AI应用服务。

AI未闻花名

689 6 7

阿里云云原生

|

2月前

|

人工智能运维安全

加速智能体开发：从 Serverless 运行时到 Serverless AI 运行时

在云计算与人工智能深度融合的背景下，Serverless 技术作为云原生架构的集大成者，正加速向 AI 原生架构演进。阿里云函数计算（FC）率先提出并实践“Serverless AI 运行时”概念，通过技术创新与生态联动，为智能体（Agent）开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。

阿里云云原生

289 3 3

阿里云开发者

|

2月前

|

数据采集存储人工智能

从0到1：天猫AI测试用例生成的实践与突破

本文系统阐述了天猫技术团队在AI赋能测试领域的深度实践与探索，讲述了智能测试用例生成的落地路径。

阿里云开发者

713 0 0

从0到1：天猫AI测试用例生成的实践与突破

TsingtaoAI

|

2月前

|

人工智能新制造

TsingtaoAI受邀参加宁波AI海曙科创训练营并分享技术落地实践

10月12日至15日，由宁波市海曙区组织部主办的AI海曙科创训练营在宁波成功举办。作为受邀企业代表，TsingtaoAI团队深入参与了多项活动，与政府领导、行业专家及科创企业代表围绕AI技术在制造业、成果转化等领域的实际应用展开交流，用真实案例诠释了“技术扎根产业”的价值逻辑。

TsingtaoAI

102 2 2

数据库知识分享者小北

|

2月前

|

人工智能运维关系型数据库

云栖大会｜AI时代的数据库变革升级与实践：Data+AI驱动企业智能新范式

2025云栖大会“AI时代的数据库变革”专场，阿里云瑶池联合B站、小鹏、NVIDIA等分享Data+AI融合实践，发布PolarDB湖库一体化、ApsaraDB Agent等创新成果，全面展现数据库在多模态、智能体、具身智能等场景的技术演进与落地。

数据库知识分享者小北

663 1 1

时光在流逝

|

2月前

|

人工智能搜索推荐数据可视化

当AI学会“使用工具”：智能体（Agent）如何重塑人机交互

当AI学会“使用工具”：智能体（Agent）如何重塑人机交互

时光在流逝

351 115 115

阿里云开发者

|

人工智能自然语言处理前端开发

产品经理也能“开发”需求？淘宝信息流从需求到上线的AI端到端实践

淘宝推荐信息流业务，常年被“需求多、技术栈杂、协作慢”困扰，需求上线周期动辄一周。WaterFlow——一套 AI 驱动的端到端开发新实践，让部分需求两天内上线，甚至产品经理也能“自产自销”需求。短短数月，已落地 30+ 需求、自动生成 5.4 万行代码，大幅提升研发效率。接下来，我们将揭秘它是如何落地并改变协作模式的。

阿里云开发者

408 37 37

产品经理也能“开发”需求？淘宝信息流从需求到上线的AI端到端实践

热门文章

最新文章

AI驱动智能化日志分析 : 通过决策树给日志做聚类分析

构建一个基于AI的推荐系统的技术探索

AI：2020北京智源大会与五位图灵奖得主和100多位专家《共同探讨人工智能的下一个十年》——6月21日~6月24日的日程安排(实时更新，建议收藏)

视觉AI五天训练营教程 Day 1

解密亚马逊Ironman计划：背靠AWS云服务发力AI，对抗谷歌微软

AI编解码优势显著，未来将与传统方法并行发展 | 专访高通AI研究方向负责人侯纪磊

这台无人机40小时经历上万次事故，终于借助AI学会了自动飞行

魔搭中文开源模型社区：模型即服务-药物设计中的开源AI模型Uni-Fold及Uni-Mol（下）

英特尔与埃森哲利用AI技术拯救珊瑚礁

AI学习教程：AI(Adobe lliustrator)快速入门

构建未来：AI驱动的自适应网络安全防御系统提升软件测试效率：自动化与持续集成的实践之路

AI技术在医疗领域的应用

Python AI 绘画

如何利用AI工具提高生产效率

构建未来：AI技术在智能交通系统中的应用

AI技术在智慧城市建设中的应用与前景

未来AI技术的无限可能性

构建未来：基于AI的移动应用开发新趋势

探索软件测试的未来：AI与自动化的融合

阿里云连续三年入围Gartner云AI开发者服务挑战者象限

相关课程

更多

通义灵码2.0 AI 编码训练营

AI应用开发

基于Gradio的AI应用搭建实践课

AI通识课-人工智能通识基础

使用Higress AI网关优化AI调用成本

基于通义灵码实现高效AI编码实践

相关电子书

更多

AI 原生应用开源开发者沙龙·上海站电子书

AI原生应用开发实战营—Serverless AI专场·北京

阿里云 AI 原生应用开发实战营

相关实验场景

更多

使用AI容器镜像部署Qwen大语言模型

【玩转ComfyUI】基于函数计算一键部署AI生图平台ComfyUI

下一篇

「直播预告」Streaming Lakehouse Meetup EP.2｜Paimon × StarRocks 共话实时湖仓