视觉智能开放平台的搜索结果_热门_第6页-阿里云开发者社区

多麻辣哦

|

问答

|

来自： ModelScope模型即服务

如何下载modelscope模型？

# 视觉智能开放平台

崔问问

|

问答

|

来自： ModelScope模型即服务

在ModelScope中，下载模型时的ssl问题怎么解决？!

# 视觉智能开放平台 # 网络安全

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Pippo：Meta放出AI大招！单张照片秒转3D人像多视角视频，AI自动补全身体细节

Pippo 是 Meta 推出的图像到视频生成模型，能够从单张照片生成 1K 分辨率的多视角高清人像视频，支持全身、面部或头部的生成。

# 视觉智能开放平台 # 存储 # 人工智能 # 编解码 # 自然语言处理 # Perl

老乡别走

|

10月前

|

博文

|

来自：视觉智能

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

在生活和工作中，我们常需处理大量PDF文件，如银行单据、税收单据等。手动处理效率低下，而使用“咕嘎批量PDF多区域内容提取重命名导表格系统”可快速完成数千份文档的处理，大幅提高效率。该工具通过获取PDF各区域内容坐标，导入并处理文件，最终将信息提取至表格，并根据关键信息对PDF进行重命名，方便管理和查找。

# 视觉智能开放平台 # 文字识别

阿里云OpenVI

|

博文

|

来自：视觉智能

FaceChain：1周3K star，3张照片打造专属形象！人人AIGC!

FaceChain团队推出了开源人物写真项目，希望结合开源社区开发者的力量，可以让图片应用更有趣、更好玩、也有更多应用场景。

# 视觉智能开放平台 # 人工智能 # 算法 # 搜索推荐 # 物联网 # 开发者

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（二十六）Linux环境安装ZLMediaKit实现视频推流

《FFmpeg开发实战》书中介绍轻量级流媒体服务器MediaMTX，但其功能有限，不适合生产环境。推荐使用国产开源的ZLMediaKit，它支持多种流媒体协议和音视频编码标准。以下是华为欧拉系统下编译安装ZLMediaKit和FFmpeg的步骤，包括更新依赖、下载源码、配置、编译、安装以及启动MediaServer服务。此外，还提供了通过FFmpeg进行RTSP和RTMP推流，并使用VLC播放器拉流的示例。

# 视觉智能开放平台 # Web App开发 # 安全 # Linux # 视频直播 # 网络安全

鸡蛋灌饼儿

|

问答

|

来自： ModelScope模型即服务

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

# 视觉智能开放平台 # 自然语言处理 # 对象存储

ModelScope运营小助手

|

博文

|

来自： ModelScope模型即服务

AI人像动漫

学术界自2000年左右开始对图像生成进行研究。日常采集到的图像数量非常有限，而且采集成本相对较高。因此，我们希望计算机能够自动化生成新的图像。但是，如果图像内容随机生成，无法控制生成结果，则图像依然不可用。

# 视觉智能开放平台 # 机器学习/深度学习 # 存储 # 人工智能 # 编解码 # 算法 # 前端开发 # 开发工具 # 计算机视觉 # 异构计算 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

SkyReels-V1：短剧AI革命来了！昆仑开源视频生成AI秒出影视级短剧，比Sora更懂表演！

SkyReels-V1是昆仑万维开源的首个面向AI短剧创作的视频生成模型，支持高质量影视级视频生成、33种细腻表情和400多种自然动作组合。

# GPU云服务器 # 视觉智能开放平台 # 数据采集 # 机器学习/深度学习 # 人工智能 # 分布式计算 # 异构计算

真的很搞笑

|

问答

|

来自：视觉智能

OCR营业执照识别失败什么原因？

# 文字识别 # 视觉智能开放平台 # 文字识别 # API

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台