视觉智能开放平台的搜索结果_热门_第18页-阿里云开发者社区

aqi00

|

7月前

|

博文

|

在Linux环境下，为FFmpeg添加对AAC、MP3、OGG和AMR音频格式的支持，需安装libogg、libvorbis和opencore-amr库。首先，从官方源下载各库的最新源码，如libogg-1.3.5、libvorbis-1.3.7和opencore-amr-0.1.6，然后解压并依次执行`./configure`、`make`和`make install`进行编译安装。接着，在FFmpeg源码目录中，使用`./configure`命令重新配置，并重新编译安装FFmpeg。最后，验证FFmpeg版本信息确认已启用ogg和amr支持。

# 视觉智能开放平台 # 编解码 # Linux

AI小怪兽

|

5月前

|

博文

|

来自： ModelScope模型即服务

一种基于YOLOv8改进的高精度红外小目标检测算法（原创自研）

【7月更文挑战第2天】 💡💡💡创新点： 1）SPD-Conv特别是在处理低分辨率图像和小物体等更困难的任务时优势明显； 2）引入Wasserstein Distance Loss提升小目标检测能力； 3）YOLOv8中的Conv用cvpr2024中的DynamicConv代替；

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 文字识别 # 算法 # 计算机视觉

aqi00

|

5月前

|

博文

|

来自：视觉智能

FFmpeg开发笔记（三十九）给Visual Studio的C++工程集成FFmpeg

在Windows上使用Visual Studio 2022进行FFmpeg和SDL2集成开发，首先安装FFmpeg至E:\msys64\usr\local\ffmpeg，然后新建C++控制台项目。在项目属性中，添加FFmpeg和SDL2的头文件及库文件目录。接着配置链接器的附加依赖项，包括多个FFmpeg及SDL2的lib文件。在代码中引入FFmpeg的`av_log`函数输出"Hello World"，编译并运行，若看到"Hello World"，即表示集成成功。详细步骤可参考《FFmpeg开发实战：从零基础到短视频上线》。

# 视觉智能开放平台 # C++ # Windows

蚝油菜花

|

11天前

|

博文

|

来自： ModelScope模型即服务

Fancy123：华中科技和华南理工推出的3D网格生成技术

Fancy123是由华中科技大学和华南理工大学联合推出的3D网格生成技术，能够从单张图片生成高质量的3D网格。该技术通过即插即用的变形技术，解决了多视图图像的局部不一致性，提高了网格对输入图像的保真度，并确保了高清晰度。Fancy123在定性和定量实验中表现出色，能够无缝集成到现有的单图像到3D的方法中。

# 视觉智能开放平台 # 人工智能

蚝油菜花

|

9天前

|

博文

|

来自： ModelScope模型即服务

MVGenMaster：复旦联合阿里等实验室推出的多视图扩散模型

MVGenMaster是由复旦大学、阿里巴巴达摩院和湖潘实验室联合推出的多视图扩散模型，专注于新视角合成（NVS）任务。该模型通过整合3D先验信息，显著提升了NVS的泛化和3D一致性，并能从单一图像生成多达100个新视图。此外，研究团队还推出了包含160万场景的大型多视图图像数据集MvD-1M，以支持模型的训练和优化。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 达摩院 # Perl

三分钟热度的鱼

|

问答

|

来自：视觉智能

OCR发票识别不到？

# 文字识别 # 视觉智能开放平台 # 文字识别

游客j2zdn5huirgo6

|

问答

|

来自： ModelScope模型即服务

ModelScope本地私有化部署模型，外部系统要怎么调用？

# 视觉智能开放平台 # API

青城山下庄文杰

|

问答

|

来自： ModelScope模型即服务

ModelScope创空间是干嘛的？

# 视觉智能开放平台

真的很搞笑

|

问答

|

来自： ModelScope模型即服务

modelscope会把多线程阻塞？

# 视觉智能开放平台

嘟嘟嘟嘟嘟嘟

|

问答

|

来自：视觉智能

视觉智能平台人脸识别页面的链接有实效性吗？会失效吗？

# 视觉智能开放平台 # 计算机视觉

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

视觉智能开放平台