语音技术的搜索结果_文章_第7页-阿里云开发者社区

Svan.

|

20天前

|

博文

基于卡尔曼滤波的声源跟踪方法研究（上）

# 存储 # 算法 # 语音技术 # 计算机视觉

ModelScope内容运营小助手

|

20天前

|

博文

如何利用 OpenVINO™ 部署 Qwen2 多模态模型

本文将分享如何利用 OpenVINO™ 工具套件在轻薄本上部署 Qwen2-Audio 以及 Qwen2-VL 多模态模型。

# 自然语言处理 # 语音技术 # 开发者 # 计算机视觉 # 异构计算

bruce刘晓伟-18435

|

20天前

|

博文

大模型的多样性：从语言处理到多模态智能

本文介绍了大模型在多个领域的应用，包括自然语言处理（如Transformer、GPT、BERT、T5）、计算机视觉（如CNN、ViT、GAN）、多模态智能（如CLIP、DALL-E）、语音识别与合成（如Wav2Vec、Tacotron）以及强化学习（如AlphaGo、PPO）。这些模型展现了卓越的性能，推动了人工智能技术的发展。

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术 # 计算机视觉

跃@sir

|

21天前

|

博文

探索深度学习在自然语言处理中的最新进展

【10月更文挑战第10天】探索深度学习在自然语言处理中的最新进展

# 自然语言处理 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 并行计算 # 语音技术

aqi00

|

21天前

|

博文

|

来自：视觉智能

FFmpeg开发笔记（五十八）把32位采样的MP3转换为16位的PCM音频

《FFmpeg开发实战：从零基础到短视频上线》一书中的“5.1.2 把音频流保存为PCM文件”章节介绍了将媒体文件中的音频流转换为原始PCM音频的方法。示例代码直接保存解码后的PCM数据，保留了原始音频的采样频率、声道数量和采样位数。但在实际应用中，有时需要特定规格的PCM音频。例如，某些语音识别引擎仅接受16位PCM数据，而标准MP3音频通常采用32位采样，因此需将32位MP3音频转换为16位PCM音频。

# 视觉智能开放平台 # 编解码 # 语音技术 # 内存技术

龙腾九州

|

22天前

|

博文

|

来自：云原生

实验介绍

【10月更文挑战第9天】实验介绍。

# 数据处理 # 语音技术

肥猪肥猪-17824

|

22天前

|

博文

探索AI的无限可能：从理论到实践

【10月更文挑战第9天】在这篇文章中，我们将深入探讨人工智能（AI）的世界，从基本概念到实际应用，再到未来发展趋势。我们将通过实例和代码示例，揭示AI如何改变我们的生活和工作方式。无论你是AI领域的新手，还是有经验的开发者，这篇文章都将为你提供有价值的信息和启示。让我们一起探索AI的无限可能吧！

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 自动驾驶 # 语音技术

万少！

|

22天前

|

博文

我写个HarmonyOS Next版本的微信聊天03-完结篇

# 智能语音交互 # 智能语音交互 # 数据采集 # 人工智能 # 前端开发 # 语音技术 # 内存技术

万少！

|

22天前

|

博文

三文带你轻松上手鸿蒙的AI语音01-实时语音识别

# 语音服务 # 智能语音交互 # 智能语音交互 # 人工智能 # 语音技术 # 数据格式

yuanzhengme

|

22天前

|

博文

RNN是什么？哪些地方应用的多？

【10月更文挑战第8天】RNN是什么？哪些地方应用的多？

# 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 语音技术

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

语音技术