视觉智能开放平台

首页 标签 视觉智能开放平台
图像文字识别(OCR)用什么算法小结
说明:主要考虑深度学习的方法,传统的方法不在考虑范围之内。 1.文字识别步骤 1.1detection:找到有文字的区域(proposal)。 1.2classification:识别区域中的文字。 2.文字检测 文字检测主要有两条线,两步法和一步法。
理解图像分割中的卷积(Understand Convolution for Semantic Segmentation)
      以最佳的101 layer的ResNet-DUC为基础,添加HDC,实验探究了几种变体: 无扩张卷积(no dilation):对于所有包含扩张卷积,设置r=1r=1 扩张卷积(dilation Conv ):对于所有包含扩张卷积,将2个bloc...
【图像算法】彩色图像分割专题一:颜色空间1(原理)
【图像算法】彩色图像分割专题一:颜色空间1(原理)  SkySeraph May 3rd 2011  HQU Email:zgzhaobo@gmail.com    QQ:452728574 Latest Modified Date:May 13rd 2011 HQU   暂时把收集的一些有用的资料链接给上,以后再补工程源码~~ 补上: 源码:http://www.
深源恒际:图像识别技术助力企业VI系统管理规范化
深源恒际,依托原创图像识别技术,为企业用户打造了VI系统规范化管理服务。基于VI系统的使用场景,VI系统规范化管理服务分为规范生成和规范检测两个应用模块。
Manga Image Translator:开源的漫画文字翻译工具,支持多语言翻译并嵌入原图,保持漫画的原始风格和布局
Manga Image Translator 是一款开源的漫画图片文字翻译工具,支持多语言翻译并能将翻译后的文本无缝嵌入原图,保持漫画的原始风格和布局。该工具基于OCR技术和深度学习模型,提供批量处理和在线/离线翻译功能。
带你读《深度学习与图像识别:原理与实践》之一:机器视觉在行业中的应用
这是一部从技术原理、算法和工程实践3个维度系统讲解图像识别的著作,由阿里巴巴达摩院算法专家、阿里巴巴技术发展专家、阿里巴巴数据架构师联合撰写。在知识点的选择上,本书广度和深度兼顾,既能让完全没有基础的读者迅速入门,又能让有基础的读者深入掌握图像识别的核心技术;在写作方式上,本书避开了复杂的数学公式及其推导,从问题的前因后果 、创造者的思考过程,利用简单的数学计算来做模型分析和讲解,通俗易懂。更重要的是,本书不仅仅是聚焦于技术,而是将重点放在了如何用技术解决实际的业务问题。
免费试用