语音技术

首页 标签 语音技术
# 语音技术 #
关注
6702内容
|
12天前
| |
阿里云产品十一月刊来啦
阿里云百炼多模态与语音识别模型全面升级,千问APP公测上线免费向用户开放|产品十一月刊
|
12天前
|
AI工具推荐 ,语音转文字,语音合成工具,永久免费版的AI工具
AI工具推荐 ,语音转文字,语音合成工具,永久免费版的AI工具
云呼叫中心升级智能语音导航:传统IVR流程平滑迁移方案
在客户体验至上的时代,传统IVR已成服务短板。本文提出基于AI语义理解的智能语音导航平滑迁移方案,涵盖评估、设计、测试到上线四步法,助力企业实现从菜单式按键到自然对话的升级,确保业务零中断,提升服务效率与客户满意度。
阿里云百炼支持哪些AI大模型?文本生成、图像生成、语音合成及视频编辑等模型整理
阿里云百炼支持通义千问、通义万相等自研模型及DeepSeek、Kimi、Llama等第三方大模型,覆盖文本生成、图像生成、语音合成、视频生成、向量计算等多类AI能力,助力开发者高效构建应用。新用户可免费领取最高5000万Tokens。
2025年数字人制作工具选型指南:从架构集成与渲染精度出发的五大评估维度
本文深入剖析数字人技术选型难题,聚焦渲染精度、生成效率与全链路集成三大核心维度。对比必火AI、UE5高定方案与开源工具的技术优劣,揭示“少样本训练+4K超清输出+多模态融合”如何破解工程落地瓶颈,助力团队避开API碎片化与实时性误区,实现分钟级视频批量生成,为不同场景提供高效可落地方案。
|
16天前
|
数字展厅升级重点推荐方案:AI数字人+智慧大屏实现低成本高互动
传统展厅升级痛点多?AI数字人+智慧大屏方案来了!无需更换硬件,低成本快速部署,支持智能问答、多语种讲解、后台一键更新内容。适配政务、企业、文旅等多场景,提升互动体验与运营效率,助力展厅迈向“可对话、会思考”的智慧新时代。
|
16天前
| |
阿里云百炼产品月刊【2025年11月】
通义千问本月重磅升级:上线10款多模态与语音模型,涵盖ASR、TTS、视觉语言及翻译;MCP市场新增3个云服务,上架24个电商应用模板;推出实训Agent创客活动,助力高效生成电商视觉内容。
情绪之眼:Rokid智能眼镜赋能特殊儿童情感沟通新桥梁
本文基于Rokid CXR-M SDK,构建面向自闭症儿童的情绪识别与干预系统,通过AR眼镜实时采集表情,结合AI分析实现情绪识别,并为照顾者提供即时应对策略。系统涵盖设备连接、视频分析、视觉与语音交互等模块,具备低延迟、便携性强、隐私安全等特点,助力特殊儿童情感沟通,推动科技向善落地。
|
19天前
|
AI数字人解锁数字展厅的“智慧大脑”,展厅互动体验焕新升级
在数字化转型浪潮中,波塔AI数字人系统以AI技术重塑展厅体验,破解传统展厅人力成本高、交互单一等痛点。支持24小时智能讲解、多模态互动、个性化推荐、多语种服务,并联动灯光、大屏等设备打造沉浸式空间。兼具品牌代言人、智能导览员与数据分析师多重角色,助力企业实现从“展示”到“服务”的智慧升级,开启展厅新时代。
|
19天前
|
一键搞定人脸识别、语音识别、车牌识别本地化!离线跑模型不装框架!!!
SmartJavaAI 是专为 Java 开发者打造的离线 AI 工具箱,集成人脸识别、OCR、语音识别、机器翻译等 20+ 主流模型,基于 DJL + JNI 封装,支持 Maven 一键引入,两行代码调用,让 Java 工程师无需掌握 Python/C++ 即可轻松接入 AI 能力,高效落地各类智能场景。
免费试用