视觉智能开放平台的搜索结果_热门_第11页-阿里云开发者社区

羽林小王子

|

博文

|

来自：视觉智能

Mediapipe三维实时人体关键点检测与追踪（一）

# 视觉智能开放平台 # 机器学习/深度学习 # JavaScript # 前端开发 # Android开发 # C++ # 计算机视觉 # iOS开发 # Python

青城山下庄文杰

|

问答

|

来自： ModelScope模型即服务

ModelScope通义千问是多大的模型参数，收费标准跟7B有差距吗？

# 视觉智能开放平台

真的很搞笑

|

问答

|

来自： ModelScope模型即服务

ModelScope有没有人知道windows安装ttsfrd的方法或者ttsfrd源码？

# 视觉智能开放平台 # Windows

GoAlaaa

|

博文

|

来自：视觉智能

CRNN文字识别

近几年来，CRNN在计算机视觉文本识别领域取得不错成果。CRNN是一种卷积循环神经网络结构，用于解决基于图像的序列识别问题，特别是场景文字识别问题。CRNN网络实现了不定长验证结合CNN和RNN网络结构，使用双向LSTM循环网络进行时序训练，并在最后引入CTC损失函数来实现端对端的不定长序列识别，

# 文字识别 # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 文字识别 # 算法 # 数据挖掘 # 计算机视觉 # Perl

zhekr76ctyjts

|

博文

|

来自： ModelScope模型即服务

达摩院CVPR2023人脸重建论文HRN解读——REALY榜单冠军模型

前言高保真 3D 人脸重建在许多场景中都有广泛的应用，例如 AR/VR、医疗、电影制作等。尽管大量的工作已经使用 LightStage 等专业硬件实现了出色的重建效果，从单一或稀疏视角的单目图像估计高精细的面部模型仍然是一个具有挑战性的任务。本文中，我们将介绍来自达摩院的CVPR2023最新的人脸重建论文，该工作在单图人脸重建榜单REALY上取得正脸、侧脸双榜第一，并在其他多个数据集中取得了SO

# 视觉智能开放平台 # 达摩院 # vr&ar # 计算机视觉

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（十五）详解MediaMTX的推拉流

MediaMTX是开源轻量级流媒体服务器，提供RTSP, RTMP, HLS, WebRTC和SRT服务。启动后，它在不同端口监听。通过FFmpeg的推拉流测试，证明了MediaMTX成功实现HLS流媒体转发，但HLS播放兼容性问题可能因缺少音频流导致。推流地址为rtsp://127.0.0.1:8554/stream，RTMP地址为rtmp://127.0.0.1:1935/stream，HLS播放地址为http://127.0.0.1:8888/stream（Chrome）和http://127.0.0.1:8888/stream/index.m3u8（其他播放器可能不支持）。

# 视觉智能开放平台 # Web App开发 # Windows

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Sa2VA：别再用PS抠图了！字节跳动开源Sa2VA：一句话自动分割视频，连头发丝都精准

Sa2VA 是由字节跳动等机构联合推出的多模态大语言模型，结合 SAM2 和 LLaVA 实现对图像和视频的精确分割和对话功能。

# 视觉智能开放平台 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具 # 计算机视觉

青城山下庄文杰

|

问答

|

来自： ModelScope模型即服务

Modelscope在某平台上带`-hf`的模型是什么意思呀？跟咱们这边的模型相比有什么区别呢？

# 视觉智能开放平台

多麻辣哦

|

问答

|

来自： ModelScope模型即服务

ModelScope中，我的推理卡，v100，不支持fp16，我要怎么改？

# 视觉智能开放平台

GoAlaaa

|

博文

|

来自：视觉智能

OCR文字识别方法综述

摘要：文字识别可以把海量非结构化数据转换为结构化数据，从而支撑各种创新的人工智能应用，是计算机视觉研究领域的分支之一，其任务是识别出图像中的文字内容，一般输入来自于文本检测得到的文本框截取出的图像文字区域。近几年来，基于深度学习的文字识别算法模型已取得不错成果，其过程无需进行特征处理且可以实现复杂场景文字识别，效果要优于传统文字识别方法，逐渐成为文字识别研究应用的主流方式。本文将主要介绍基于深度学习的文字识别技术综述，分类总结主流文字识别经典算法，讨论未来文字识别领域发展与研究趋势。

# 文字识别 # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 文字识别 # 自然语言处理 # 算法 # 数据挖掘 # 图形学 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台