开发者社区> 问答> 正文

阿里云语音AI阿里云有说话人分离的服务吗?或者,谁知道通义听悟API可否返回分离后的语音文件?

阿里云语音AI阿里云有说话人分离的服务吗?或者,谁知道通义听悟API可否返回分离后的语音文件?

展开
收起
青城山下庄文杰 2023-11-20 19:29:47 192 0
3 条回答
写回答
取消 提交回答
  • 阿里云语音AI提供了多种语音处理服务,其中包括语音转文本、文本转语音、语音合成、语音识别等。然而,目前阿里云语音AI并没有提供说话人分离的服务。

    说话人分离是一种音频处理技术,可以将一段录音中的多个说话人的声音分开,提取出每个人的单独语音。这种技术在许多领域都有应用,例如会议记录、电话客服、视频监控等。

    至于通义听悟API,这是由阿里巴巴集团开发的一种语音处理API,可以提供语音识别、语音合成、语音转写等服务。然而,根据其官方文档,通义听悟API并不直接返回分离后的语音文件。它主要返回的是文本信息,例如语音转写的结果。

    如果你需要进行说话人分离,可能需要寻找其他的音频处理工具或服务。例如,Google的DeepSpeech项目就提供了说话人分离的功能。

    2023-11-29 15:11:30
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    阿里云语音AI确实提供了说话人分离的服务,它可以帮助用户将多人讲话的音频文件分离成单独的轨道,这样就可以方便地对每个人的语音进行进一步处理。

    同时,通义听悟 API 是阿里云语音 AI 的一个子产品,主要用于实现语音内容的理解和分析。虽然我没有找到明确的官方说明,但在实际应用中,通义听悟 API 应该是可以返回分离后的语音文件的,因为它本身就需要首先解析并分离出每个人的声音才能进行后续的内容理解和分析工作。

    2023-11-20 21:40:04
    赞同 展开评论 打赏
  • 您好,通义听悟可以区分不同说话人的内容,您可以看下这个参数:iwEcAqNwbmcDAQTRBd8F0QIyBrDBTyvhND2vpgVDjaPaQDAAB9IFq57nCAAJomltCgAL0gAFV34.png_720x720q90.jpg
    此回答整理自钉群“阿里语音AI【3群】”

    2023-11-20 20:53:23
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Spring Boot2.0实战Redis分布式缓存 立即下载
CUDA MATH API 立即下载
API PLAYBOOK 立即下载