语音技术的搜索结果_热门_第5页-阿里云开发者社区

长空翱翔

|

博文

1.依次打开“区域与语言”->“键盘与语言”->“更改键盘”->“语言栏”，查看是否如下设置：图1 2 点“开始→运行”，键入“msconfig”，单击“确定”或回车运行“系统配置实用程序”，在“启动”里把“Ctfmon.exe”选中，单击“确定”。

# Windows # 文字识别 # 语音技术

游客vphb4ae2je2zi

|

15天前

|

博文

|

来自：阿里云百炼

阿里云百炼支持哪些AI大模型？文本生成、图像生成、语音合成及视频编辑等模型整理

阿里云百炼支持通义千问、通义万相等自研模型及DeepSeek、Kimi、Llama等第三方大模型，覆盖文本生成、图像生成、语音合成、视频生成、向量计算等多类AI能力，助力开发者高效构建应用。新用户可免费领取最高5000万Tokens。

# 大模型服务平台百炼 # 人工智能 # 自然语言处理 # 数据挖掘 # 语音技术 # 数据安全/隐私保护

初商

|

博文

示范了200句后，我的声音“双胞胎”诞生了！

使用本文提出的语音合成中的说话人自适应技术，用户只需要录制200句话，便能够获得与1000句话普通的语音合成系统相当的效果。

# 语音技术 # 算法 # 机器学习/深度学习 # 自然语言处理

bailiantest1

|

1月前

|

博文

|

来自：阿里云百炼

阿里云百炼产品月报【2025年10月】

本月重点：通义千问发布9款Qwen3-VL多模态新模型，覆盖32B至8B多种尺寸，支持思考模式、超长视频理解及2D/3D定位，并推出统一多模态向量与高精度语音识别模型。MCP生态新增17个云服务，电商AI应用模板上线，支持一键生成商品图与宠物店数字人视频，助力高效内容创作。

# 大模型服务平台百炼 # 人工智能 # 缓存 # 搜索推荐 # 语音技术 # vr&ar

即兴小索奇

|

博文

什么是数据标注

# 机器学习/深度学习 # 自然语言处理 # 数据处理 # 定位技术 # 语音技术

modelscope

|

6天前

|

博文

|

来自： ModelScope模型即服务

智谱开源GLM-ASR：动动嘴，活就干了

智谱发布并开源GLM-ASR系列语音识别模型，推出桌面端AI输入法。包含云端旗舰模型GLM-ASR-2512与端侧轻量版GLM-ASR-Nano-2512（仅1.5B参数），实现高精度、低延迟、强隐私保护的语音转写。输入法集成大模型能力，支持语音指令、翻译、改写、人设切换、Vibe Coding等功能，让用户“动嘴干活”，提升办公效率。现已免费开放体验。

# 人工智能 # 自然语言处理 # 语音技术 # 数据安全/隐私保护 # 开发者

杨琬祯

|

博文

深思考人工智能 CEO 杨志明：多模态语义理解，是机器能否实现智能的关键 | 2019 WISE 超级进化者大会

未来随着5G、物联网以及产业互联网的发展，要深植边缘计算和中央智能，成为万物互联里面的语义理解的大脑。未来的设备不光能听到、看到，而且能理解你、听懂你、看懂你，更好地为你服务。

# 图像识别 # 智能语音交互 # 智能语音交互 # 人工智能 # 语音技术 # 物联网 # 智能硬件 # 人机交互

石臻说AI

|

7月前

|

博文

推荐几个常用免费的文本转语音工具

本文推荐了几款免费的文本转语音工具，包括功能全面的AI易视频、支持多语言的Google TTS、操作便捷的Natural Reader、离线使用的Balabolka以及轻量级的Speech2Go。其中AI易视频特别适合小说转语音，可智能分配角色音色，打造广播剧般的听觉体验。这些工具各具特色，能满足不同场景需求，助力内容创作更高效。

# 人工智能 # 自然语言处理 # API # 语音技术 # 开发者

linxinliang

|

博文

人工智能的奇妙世界：从 AI 到 AIGC，再到大模型与 AGI

# 人工智能 # 自然语言处理 # 搜索推荐 # 语音技术

bailiantest1

|

5天前

|

博文

|

来自：通义大模型

Qwen3-Omni新升级:声形意合，令出智随！

Qwen3-Omni-Flash-2025-12-01是全新升级的全模态大模型，支持文本、图像、音频、视频输入，实现自然语音与文本同步输出。全面优化音视频理解与生成，支持多轮流畅对话、自定义人设与系统指令，提升多语言及跨模态交互准确性，语音更拟人，图像视频理解更深入，打造“声形意合”的智能交互体验。（239字）

# 大模型服务平台百炼 # 人工智能 # 自然语言处理 # 文字识别 # 语音技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术