文档备案控制台

开发者社区视觉智能文字识别正文

文字识别OCR有获取pdf文件页数的接口么？

文字识别OCR有获取pdf文件页数的接口么？因为现在pdf文件内容识别有限制20页，想要预处理一下。这是用的产品。
https://market.aliyun.com/products/57124001/cmapi00043678.html?spm=5176.2020520132.101.7.1bd37218z5xp6p#sku=yuncode37678000010

展开

收起

小小鹿鹿鹿 2023-11-13 18:19:53 388 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

4 条回答

写回答

取消提交回答

sunrr

阿里云的OCR文字识别服务提供了多种接口，包括通用文字识别、身份证识别、银行卡识别、车牌识别等。但是，根据我查阅的信息，这些接口并没有直接提供获取PDF文件页数的功能。

如果你需要预处理PDF文件，例如确定文件的总页数，你可能需要使用其他的API或者工具。例如，你可以使用阿里云的OSS（对象存储服务）来获取文件的大小，然后根据PDF文件的平均页大小来估算总页数。或者，你也可以使用其他第三方的PDF处理库或服务来获取PDF文件的页数。

2023-11-30 16:01:34

赞同展开评论
陌/

文字识别OCR可以获取PDF文件的页数。在阿里云的文字识别OCR中，如果遇到超出PDF页数和大小限制的情况，可以考虑将超出限制的PDF文件分割成多个较小的文件进行处理。此外，福昕PDF编辑器也提供了OCR文字识别功能，可以导入pdf文件或直接将文件拖入该页面，设置需要识别的页面、页数等参数，然后点击“开始识别”。

2023-11-15 08:02:35

赞同展开评论
小小杳杳杳

没有获取页数的接口。这个你可以百度找找。示例比较多的。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

2023-11-14 23:08:11

赞同展开评论
1941623231718325

没有获取页数的接口

2023-11-14 13:58:42

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

印刷文字识别文字识别文字识别ocr PDF ocr PDF文件印刷文字识别pdf

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

文字识别OCR ocr可以识别pdf么？

354

3

0

文字识别OCR PDF里面有多张发票的话，可以全部识别嘛？

285

2

0

对于体检报告pdf要想提取里边的所有数据用文字识别OCR什么产品比较好？

203

1

0

要在灵积中使用`pdf_extracter`插件，请问文件该从哪里读取？

143

0

0

用户通过前端界面上传 PDF/DOC 等文件如何从OSS获取到上传的文件并进行相应的处理任务？

242

1

0

阿里云网盘与相册这个方式现在只能发PDF，有办法发其他格式的文件吗？

221

1

0

请问下OSS里存的大写后缀的PDF文件，智能媒体管理是不支持预览吗，只能修改源文件后缀嘛？

305

1

0

在文字识别OCR中，阿里云有直接识别PDF文件的OCR吗？

268

3

0

需要在钉钉小程序内部预览pdf文件，并且不能上传到钉盘，请问我该怎么做

297

0

0

文档智能pdf 文件里图片中文字能提取到吗？

163

1

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

ECS GPU 上跑 vLLM：模型目录、镜像和 runtime 排查记录

“数字大脑”对企业到底有多重要，看JBoltAI的方法论

HiDream-O1开源：8B参数像素级统一Transformer

移动优先策略下二维码钓鱼攻击激增机理与闭环防御体系研究

阿里云百炼Qwen3.7-Max简介：能力、优势、支持订阅计划参考

热门讨论

热门文章

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

身份证识别ocr，每次购买需要更换url地址吗？

文字识别ocr支持android吗，android sdk文档链接有不？

OCR报错460什么意思？

文字识别ocr识别图片有大小限制吗？

在文字识别OCR中使用ocr报token已过期是啥操作，每次换个密钥就好？

文字识别OCR目前有哪些情况会导致识别失败？

文字识别OCR有没有文章自然段落识别的接口呀？

文字识别OCR已经开通了可是总是报错误码401是为什么呢？

文字识别OCR体验了一下，识别不出来，麻烦帮我看下怎么解决？

展开全部

图像文字识别(OCR)用什么算法小结

使用图像文字识别技术获取失信黑名单

OCR文字识别技术总结（一）

分析对比大模型OCR、传统OCR和深度学习OCR

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

通过容器搭建开源文字识别/OCR服务

OCR文字识别方法综述

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

展开全部

还有其他疑问?