开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别ocr识别图片有大小限制吗?

文字识别ocr识别图片有大小限制吗?

展开
收起
2401。 2023-08-27 09:48:08 384 0
7 条回答
写回答
取消 提交回答
  • 1439f673c0fd30c5e9ccbeed29d89e6e.png 此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”。

    2023-08-28 19:59:58
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,阿里云的文字识别OCR服务对图片的大小有一定限制。具体而言,图片大小应该不超过4MB。如果图片大小超过4MB,建议先进行压缩处理,然后再进行OCR识别。此外,还需要注意的是,OCR识别精度会受到图片质量、光线、拍摄角度、文字颜色等因素的影响。因此,在使用OCR识别服务时,也需要注意这些因素,以提高识别准确率。

    2023-08-28 09:14:38
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    阿里云文字识别服务要求单张图片大小不超过10M, 图片最长边不超过4096像素,最短边不小于15像素,当长边超过1024像素时,长宽比不超过1:10; 若对响应时长有较高要求的客户,图片大小建议控制在1.5M以内。
    image.png

    图片像素大小没有具体要求,单字大小在10-50像素内,识别效果比较好;尽量选择图像清晰度高、无反光的图片。若图片有旋转角度,算法会自动修正。具体的识别率与具体图片质量有较大关系。
    如有相关问题可以提工单
    image.png

    2023-08-28 09:13:33
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    是的,阿里云文字识别OCR对于识别图片有大小限制。根据阿里云的官方文档,OCR识别服务对于单个请求中上传的图片的大小限制是:

    • 非PDF识别接口(如通用文字识别接口、身份证识别接口等):最大支持5MB的图片大小。
    • PDF识别接口:最大支持20MB的图片大小。

    这些限制仅适用于单个请求中上传的图片大小。如果您的图片超过了限制,您需要将其压缩或裁剪至符合限制的大小,或采取其他的处理方法。

    OCR识别服务对于图片的分辨率和质量也有要求。为了提高识别的准确性,建议使用高质量、清晰度较高的图片,并尽量避免模糊、变形或有明显错位的图片。

    2023-08-27 23:33:02
    赞同 展开评论 打赏
  • 阿里云的文字识别OCR服务对于识别图片有一定的大小限制。具体的限制因服务版本和使用情况而有所不同。以下是一些常见的限制:
    image.png
    image.png

    1. 图片大小限制:通常,单个请求中上传的图片大小不能超过某个固定值(例如,5MB或10MB)。超过这个限制的图片可能无法被正确处理。

    2. 分辨率限制:识别OCR服务对于图片的分辨率也有限制,通常建议图片分辨率在300dpi到600dpi之间。过高或过低的分辨率可能会对识别准确性产生影响。

    3. 长宽比限制:OCR服务可能对图像的长宽比有一定的限制。如果图像的长宽比超出了允许的范围,可能会导致识别结果不准确。

    4. 请求并发数限制:针对某些OCR服务,同时发起的请求数量可能会受到限制。这意味着在某个时间段内,您可能无法同时处理大量的图片识别请求。

    2023-08-27 20:27:01
    赞同 展开评论 打赏
  • 是的,图片大小有限制。推荐上传JPG图片格式,图片大小建议1M以内。可在图片采集端尽量扩大要识别文字的区域,并保证图片内文字清晰人眼可辨认、倾斜度不得小于30%。

    2023-08-27 11:28:09
    赞同 展开评论 打赏
  • 十年摸盘键,代码未曾试。 今日码示君,谁有上云事。

    阿里云文字识别服务要求单张图片大小不超过10M, 图片最长边不超过8192像素,最短边不小于15像素,当长边超过1024像素时,长宽比不超过1:50; 若对响应时长有较高要求的客户,图片大小建议控制在1.5M以内,并且通过传图片链接调用接口。

    图片像素大小没有具体要求,单字大小在10-50像素内,识别效果比较好;尽量选择图像清晰度高、无反光的图片。若图片有旋转角度,算法有自动修正功能。具体的识别率与具体图片质量有较大关系。

    通常情况下阿里云文字识别提供的接口仅支持单张图片的识别,若需要对多种类型图片识别可参考如下产品:

    混贴发票识别,可支持一张图片上有多张混贴图的场景,系统可自动进行分区、分类与结构化识别。体验地址为OCR读光体验中心。

    读光OCR识别接口均支持图片格式数据,包括:png/.jpg/.jpeg/.jpe/.bmp/.gif/.tiff/.tif/.webp,部分接口支持单页PDF,PDF大小不超过10M。

    2023-08-27 10:16:58
    赞同 1 展开评论 打赏
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载