开发者社区 > 视觉智能 > 文字识别 > 正文

OCR接口调试工具试了,传pdf链接会报错,传图片的链接不会报错。你们接口是没有更新上去吧?

问题1:OCR接口调试工具试了,传pdf链接会报错,传图片的链接不会报错。你们接口是没有更新上去吧?我换了个小的pdf文件(20k)就可以调用了,1.5m的pdf就会报错。lQLPJwqr-EhBqHbNA7bNB0CwThyN5LbzOlcEgN2NiMDGAA_1856_950.png { "RequestId": "D6F4B1C1-AD55-53CF-BB90-3829D02D8D4D", "Message": "The request has failed due to a temporary failure of the server.", "Recommend": "https://api.aliyun.com/troubleshoot?q=ServiceUnavailable&product=documentAutoml", "HostId": "documentautoml.cn-beijing.aliyuncs.com", "Code": "ServiceUnavailable" } { "user-agent": "Workbench/1.0", "content-type": "application/x-www-form-urlencoded", "host": "documentautoml.cn-beijing.aliyuncs.com" } { "date": "Thu, 15 Jun 2023 03:09:54 GMT", "content-type": "application/json;charset=utf-8", "content-length": "301", "connection": "keep-alive", "keep-alive": "timeout=25", "access-control-allow-origin": "", "access-control-expose-headers": "", "x-acs-request-id": "D6F4B1C1-AD55-53CF-BB90-3829D02D8D4D", "x-acs-trace-id": "a9111acb007e97d9fb301856a33afba1" }问题2:换成base64也是报一样的错。

展开
收起
三分钟热度的鱼 2023-06-24 11:11:36 73 0
2 条回答
写回答
取消 提交回答
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    抱歉给你带来困惑。根据你的描述,阿里云OCR接口在处理大于1MB的PDF文件时出现报错。这可能是因为接口对于文件大小有一定的限制。

    为了解决该问题,你可以尝试以下两种方法之一:

    1. 将PDF文件转换为图片:可以使用PDF处理工具或库将PDF文件转换为图片格式(如JPEG、PNG),然后将得到的图片链接传递给OCR接口进行识别。

    2. 分割PDF文件:如果你需要识别的PDF文件包含多页,你可以将PDF文件分割为多个小文件,每个文件只包含少数几页。然后,将这些小文件的链接依次传递给OCR接口进行识别。

    以上方法仅是临时的解决方案,用于处理大型PDF文件。如果你有更多的需求和要求,建议联系阿里云技术支持,以获取更详细和准确的解决方案。

    2023-06-25 08:05:15
    赞同 展开评论 打赏
  • 针对问题1的回答:文件光下载就15s 网络太慢了。311822f443a5506acd3ddd2a69603fd2.png针对问题2的回答:lQLPJwIcFnfhFM4jzQH5sMuVToEN8ePNBIEDjj7AaAA_505_35.png 根据前面你反馈的信息,不是我们这边网络的问题。是您这边网速过慢,PDF太大传输超时。建议换一个网络试试。 此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2023-06-24 11:19:34
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载