达摩院的搜索结果_热门_第8页-阿里云开发者社区

ModelScope运营小助手

|

博文

|

来自： ModelScope模型即服务

101 个 CV 模型集体开源，魔搭社区视觉 AI 深度解析

本文，阿里达摩院开放视觉智能负责人谢宣松，深入解析了魔搭社区里首批开源的 101 个视觉 AI 模型。

# 云解析DNS # 机器学习/深度学习 # 人工智能 # 编解码 # 达摩院 # 算法 # 自动驾驶 # API # 数据安全/隐私保护 # 计算机视觉 # 开发者

渚薰大神EVA

|

博文

虚拟偶像诞生记 - 数字人行业和技术探究

为你讲述当前业界的现状，包括不同行业中的showcase和优秀的技术/创作平台，引出近几年比较火热的元宇宙概念，包含多个核心技术点，同时畅想数字人在未来的技术增长和业务价值，以及当下我们该如何布局。

# 虚拟数字人 # 机器学习/深度学习 # 数据采集 # 人工智能 # 达摩院 # 前端开发 # 算法 # 大数据 # 语音技术 # vr&ar # 芯片

-开发达人-

|

博文

|

来自： ModelScope模型即服务

魔搭中文开源模型社区：模型即服务-魔搭社区产品生态介绍（中）

魔搭中文开源模型社区：模型即服务-

# 数据采集 # 机器学习/深度学习 # 人工智能 # 达摩院 # 自然语言处理 # 数据可视化 # 开发工具 # 算法框架/工具 # 开发者 # Python

CloudImagine

|

博文

一文深度解读多模态大模型视频检索技术的实现与使用

自然语言视频检索已上线IMS

# 自然语言处理 # 存储 # 人工智能 # 自然语言处理 # 达摩院 # 算法

-开发达人-

|

博文

|

来自：通义大模型

阿里通义千问大模型加持，专攻音视频生产力的「听悟」来了

# 智能语音交互 # 智能语音交互 # 大模型服务平台百炼 # Web App开发 # 人工智能 # 达摩院 # 自然语言处理 # 算法 # 语音技术

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

ClearerVoice-Studio：阿里通义开源的语音处理框架，提供语音增强、分离和说话人提取等功能

ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架，集成了语音增强、分离和音视频说话人提取等功能。该框架基于复数域深度学习算法，能够有效消除背景噪声，保留语音清晰度，并提供先进的预训练模型和训练脚本，支持研究人员和开发者进行语音处理任务。

# 智能语音交互 # 机器学习/深度学习 # 人工智能 # 达摩院 # 算法 # 语音技术

AIoT_小安

|

博文

|

来自：视觉智能

阿里云文字识别（OCR）服务 Quick Start

阿里云文字识别（Optical Character Recognition，OCR）可以将图片中的文字信息转换为可编辑文本，是一款由阿里巴巴达摩院权威AI团队打造的全栈全场景OCR文本识别类产品。根据客户的业务场景和需求，将产品分为了通用文字识别、个人证照识别、票据凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种文字识别等，满足各种客户的图片识别需求。由于阿里云视觉智能开放平台和云市场这两个渠道下也具备阿里文字识别服务，一些不熟悉的客户很容易将三者搞混淆，这边简单做下对比。然后再针对个人证照识别下常见的服务-身份证识别功能简单介绍下产品的开通及使用。

# 文字识别 # 视觉智能开放平台 # 人工智能 # 文字识别 # 达摩院 # Java # API # Maven # 开发工具

刘悦的技术博客

|

博文

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型，它具有高精度、高效率、便捷部署的优点，支持快速构建语音识别服务，最重要的是，FunASR支持标点符号识别、低语音识别、音频-视觉语音识别等功能，也就是说，它不仅可以实现语音转写，还能在转写后进行标注，一石二鸟。

# 智能语音交互 # 智能语音交互 # 人工智能 # 达摩院 # 并行计算 # 语音技术 # C++

技术君

|

博文

52个AIGC视频生成算法模型介绍（上）

# 机器学习/深度学习 # 人工智能 # 达摩院 # 算法 # API

小华同学ai

|

5月前

|

博文

GitHub 1.3k 一款能“填色回忆”的神器：DDColor 让老照片鲜活又逼真

DDColor 是阿里达摩院推出的图像自动着色模型，采用双解码器架构与 Colorfulness Loss 技术，实现黑白图到高保真彩色图的智能转换。支持 GPU/CPU 推理，兼容历史照片、动画、游戏截图等多场景，具备高效、真实、多样、易用等特点，广泛适用于影像修复、艺术创作等领域。

# 机器学习/深度学习 # 达摩院 # PyTorch # 算法框架/工具 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

达摩院