语音技术的搜索结果_第11页-阿里云开发者社区

游客zgpj24g7otvsu

|

3月前

|

博文

本文介绍了如何使用 Poetry 打包并发布一个 Python 项目至 PyPI。内容包括：项目创建、配置 `pyproject.toml` 文件、构建软件包、上传至 PyPI、安装与使用。通过实例 iGTTS 展示了从开发到发布的完整流程，帮助开发者快速分享自己的 Python 工具。

# API # 语音技术 # 开发者 # 索引 # Python

荔枝科研社

|

3月前

|

博文

通过短时倒谱(Cepstrogram)计算进行时-倒频分析研究（Matlab代码实现）

# 机器学习/深度学习 # 编解码 # 运维 # 算法 # 语音技术

袁长猛

|

3月前

|

博文

IndexTTS2.0_ 情感表达与时长可控的自回归零样本语音合成突破

IndexTTS2 是首个实现自回归模型下**时长可控**、**情感与音色解耦**的零样本语音合成系统。支持语音克隆、情感迁移与文本驱动情绪控制，适用于影视配音、虚拟主播等场景。开源代码与模型已发布，提供完整本地部署方案，大幅提升语音合成的实用性与表现力。

# 自然语言处理 # 语音技术 # 开发工具 # git # Python

荔枝科研社

|

3月前

|

博文

基于人工神经网络的类噪声环境声音声学识别（Matlab代码实现）

# 机器学习/深度学习 # 移动开发 # 编解码 # 安全 # 语音技术

modelscope

|

3月前

|

博文

|

来自： ModelScope模型即服务

B站开源IndexTTS2，用极致表现力颠覆听觉体验

在语音合成技术不断演进的背景下，早期版本的IndexTTS虽然在多场景应用中展现出良好的表现，但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题，并进一步推动零样本语音合成在实际场景中的落地能力，B站语音团队对模型架构与训练策略进行了深度优化，推出了全新一代语音合成模型——IndexTTS2 。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术 # vr&ar

sysin

|

3月前

|

博文

Cisco NX-OS 10.6(1)F 发布 - 数据中心网络操作系统

# Devops # API # 语音技术 # 数据中心 # 虚拟化

modelscope

|

3月前

|

博文

|

来自： ModelScope模型即服务

魔搭社区模型速递（8.30-9.06）

🙋魔搭ModelScope本期社区进展：3361个模型，313个数据集，73个创新应用， 8篇内容

# 人工智能 # 自然语言处理 # 前端开发 # 测试技术 # 语音技术

nefelibata

|

3月前

|

博文

AI电话客服的服务质量提升路径：关键技术与典型应用场景解析

AI电话客服正从基础语音工具进化为能处理复杂业务的智能体。本文深入解析服务质量提升的关键技术路径与行业应用，涵盖语音识别、情感分析、多轮对话等核心技术，以及智能外呼、自动质检、客户数据分析等典型场景，助力零售、电商、制造、互联网等行业构建高效、有温度的智能客服体系，推动人机协同服务升级。

# 客服工作台 # 云解析DNS # 人工智能 # 自然语言处理 # 机器人 # 数据挖掘 # 语音技术

delacroix_xu-15509

|

3月前

|

博文

|

来自：大数据与机器学习

Step-Audio2 声音克隆详细介绍

Step-Audio2是StepFun于2024年推出的中文语音克隆大模型，支持“一句话克隆+情感可控+实时流式”一体化生成，参数总量300M，首包延迟低至120ms，MOS达4.4+，采用Apache-2.0协议开源，适配商业应用，是当前中文TTS领域开源落地门槛最低的方案之一。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 并行计算 # 语音技术

modelscope

|

3月前

|

博文

|

来自： ModelScope模型即服务

开源SOTA：阶跃发布端到端语音大模型Step-Audio 2 mini！

大家好，今天阶跃星辰正式发布最强开源端到端语音大模型 Step-Audio 2 mini，该模型在多个国际基准测试集上取得 SOTA 成绩。

# 机器学习/深度学习 # 人工智能 # 测试技术 # 语音技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术