智能语音交互的搜索结果_热门_第19页-阿里云开发者社区

本特利的A计划

|

博文

天猫精灵开放平台体验创建语音技能

天猫测评活动——创建一个语音技能的真实操作流程记录

# 智能语音交互 # 智能语音交互 # 自然语言处理 # JavaScript # Java # Python

君伟说

|

博文

Flutter集成百度语音识别(Android端)实战

# 智能语音交互 # 智能语音交互 # 人工智能 # Dart # Java # API # 语音技术 # 开发工具 # Android开发

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Voice-Pro：开源AI音频处理工具，集成转录、翻译、TTS等一站式服务

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言，适用于教育、娱乐和商业等多个领域，为用户提供一站式的音频处理解决方案，极大地提高工作效率和音频处理的便捷性。

# 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 算法 # 语音技术

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Zonos：油管博主集体转粉！开源TTS神器Zonos爆火：克隆你的声音说5国语言，还能调喜怒哀乐

Zonos 是 ZyphraAI 推出的开源多语言 TTS 模型，支持语音克隆、情感控制和多种语言，适用于有声读物、虚拟助手等场景。

# 智能语音交互 # 人工智能 # 编解码 # 自然语言处理 # 语音技术 # Apache

modelscope

|

10月前

|

博文

|

来自： ModelScope模型即服务

王炸组合，阶跃星辰SOTA模型Step-Video和Step-Audio模型开源

2025 年 2 月 18 号，阶跃星辰宣布开源了两款 Step 系列多模态模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音交互模型。

# 智能语音交互 # 机器学习/深度学习 # 编解码 # 自然语言处理 # 测试技术 # 语音技术

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

URO-Bench：端到端语音对话模型评测黑马！多语言/多轮/副语言全维度一键开测

URO-Bench 是一款专为端到端语音对话模型设计的全面基准测试工具，涵盖多语言、多轮对话、副语言信息等多维度任务，帮助开发者全面评估模型性能。

# 智能语音交互 # 人工智能 # 自然语言处理 # 测试技术 # 语音技术 # 开发者

wljslmz

|

博文

什么是语音识别的语音助手？

【4月更文挑战第8天】

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 算法 # 语音技术 # 智能硬件

-编程工程师-

|

博文

开源上新｜FunASR英文离线文件转写软件包发布

# 智能语音交互 # 智能语音交互 # Java # 测试技术 # 语音技术 # 开发者 # 人工智能

丰宝宝

|

博文

智能语音识别技术的现状与未来发展趋势####

【10月更文挑战第21天】本文深入探讨了智能语音识别技术的发展脉络、当前主要技术特点及面临的挑战，并展望了其未来的发展趋势。通过分析传统声学模型与深度学习技术的融合、端到端建模的兴起以及多模态交互的探索，揭示了智能语音识别技术向更高精度、更强鲁棒性迈进的必然趋势。同时，文章也指出了数据隐私、噪声干扰等挑战，并提出了相应的解决方案和研究方向，为智能语音识别技术的未来发展提供了参考。 ####

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 搜索推荐 # 安全 # 语音技术

热烈的马

|

博文

Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战（超详细附源码）

# 智能语音交互 # 智能语音交互 # JSON # 自然语言处理 # Java # 语音技术 # Android开发

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

智能语音交互