视觉智能开放平台的搜索结果_热门_第14页-阿里云开发者社区

真的很搞笑

|

问答

|

来自：视觉智能

身份证识别ocr，每次购买需要更换url地址吗？

# 文字识别 # 视觉智能开放平台 # 文字识别

青城山下庄文杰

|

问答

|

来自：视觉智能

文字识别OCR怎么做作业&试卷的自动批改？

# 文字识别 # 视觉智能开放平台 # 文字识别

青城山下庄文杰

|

问答

|

来自： ModelScope模型即服务

ModelScope通义千问是多大的模型参数，收费标准跟7B有差距吗？

# 视觉智能开放平台

赵四司机

|

博文

|

来自：视觉智能

【计算机视觉】图像增强----直方图均衡化

主要介绍图像增强中直方图均衡化的原理以及相关实操及分析。

# 视觉智能开放平台 # 计算机视觉

GoAlaaa

|

博文

|

来自：视觉智能

OCR文字识别技术总结（二）

总结：以上第一部分介绍我国OCR发展历程，从过程中可以发现，我国的光学字符识别研究相对国外起步较晚，但是发展十分迅速。从早期简单的单体识别发展到多种字体混合排列的多体识别，从中文印刷材料的识别发展到中英文混排印刷材料的双语言识别，目前各个系统都可以支持简、繁体汉字的识别，同时支持中，英，韩等多国文字的识别系统，对于简单版面可以进行效的定量分析，同时汉字识别率已经可以达到98%以上，以下第二部分将从不同字体展开对OCR技术描述。

# 文字识别 # 视觉智能开放平台 # 机器学习/深度学习 # 数据采集 # 编解码 # 文字识别 # 算法 # 数据挖掘 # 人机交互 # 计算机视觉

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（四十八）从0开始搭建直播系统的开源软件架构

音视频技术广泛应用于直播系统，涵盖电视、电脑、手机直播等多种形式，并延伸至在线教育、医疗咨询和安全监控等领域。直播系统涉及实时编解码与传输，技术实现较复杂。从用户角度看，直播系统分为来源方和观看方，但在开发者视角下还需加入云平台作为中转。本文提出一套基于全开源软件的直播系统架构，分为三层：开源直播录制软件（如OBS Studio、RTMP Streamer），开源流媒体服务器（如SRS、ZLMediaKit），以及开源音视频播放器（如VLC media player、ExoPlayer）。这些组件共同构成一个高效、灵活且成本低廉的直播解决方案。

# 视觉智能开放平台 # Web App开发 # 编解码 # Linux # Android开发 # 开发者

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

OOTDiffusion：开源AI虚拟试衣工具，智能适配性别和体型自动调整衣物

OOTDiffusion是一款开源的AI虚拟试衣工具，能够智能适配不同性别和体型，自动调整衣物尺寸和形状，生成自然贴合的试穿效果。该工具支持半身和全身试穿模式，操作简单，适合服装电商、时尚行业从业者及AI试穿技术爱好者使用。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # UED

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

JoyGen：用音频生成3D说话人脸视频，快速生成逼真的唇部同步视频

JoyGen 是京东和香港大学联合推出的音频驱动的3D说话人脸视频生成框架，支持多语言、高质量视觉效果和精确的唇部与音频同步。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 计算机视觉

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Lumina-Image 2.0：上海 AI Lab 开源的统一图像生成模型，支持生成多分辨率、多风格的图像

Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型，参数量为26亿，基于扩散模型和Transformer架构，支持多种推理求解器，能生成高质量、多风格的图像。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 自然语言处理 # 算法框架/工具

老乡别走

|

5月前

|

博文

|

来自：视觉智能

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

竖排繁体文字识别系统适用于古籍数字化、港澳台文档、书法作品、历史档案及学术研究等场景，支持图像预处理、自动旋转、OCR识别、竖转横与繁转简。通过咕嘎OCR与OpenCC技术，实现高效精准的文字转换与编辑。

# 视觉智能开放平台 # 机器学习/深度学习 # 缓存 # 文字识别 # 算法 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台