备案控制台

开发者社区视觉智能文字识别正文

文字识别ocr中我们的需求是要识别 pdf 中的内容，包含文本，图片以及图片格式的表格哪个合适呢？

文字识别ocr中我们的需求是要识别 pdf 中的内容，包含文本，图片以及图片格式的表格，图片可能是横向的。哪个接口更合适呢？类似与这样的 pdf 文件。

展开

收起

小小鹿鹿鹿 2023-11-20 21:57:20 163 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
文字识别 OCR 提供几种不同的识别方案，包括文本识别、图片识别和表格识别。
对于 PDF 文件中的内容，可以根据不同的需求选用相应的 OCR 方案，一般情况下可以采用以下方法：
1. 文本识别：适用于 PDF 文件中的文本。
2. 图片识别：适用于 PDF 文件中的图片内容。
3. 表格识别：适用于 PDF 文件中的表格。
此外，文字识别 OCR 可以智能识别 PDF 文件中的表格内容，并返回表格结构信息。
最后，在使用文字识别 OCR 解决 PDF 文件的文本、图片和表格时，应根据实际需要选取相应的方案。
2023-11-21 21:51:21

赞同 1 展开评论
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，看了你的问题，阿里云OCR中的pdf表格识别和pdf文档识别接口可能更适合你。

pdf表格识别接口可以识别 PDF 中的表格，支持表格中包含文字和图片。

pdf文档识别接口可以识别 PDF 中的文字和图片，包括横向的图片。

这里，你可以根据实际情况选择使用相应的接口。

2023-11-20 22:08:17

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

印刷文字识别文本文字识别ocr 印刷文字识别文字识别 PDF表格印刷文字识别表格

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

在宜搭普通表单里面，怎么实现pdf转换成图片，同时保留pdf文件，

624

3

0

宜搭PDF组件怎么样转化成图片。

99

0

0

文字识别OCR ocr可以识别pdf么？

215

3

0

文字识别OCR PDF里面有多张发票的话，可以全部识别嘛？

119

2

0

文档智能接口可以识别图片、PDF、Excel、Word的内容，然后自动分析内容吗？

322

2

0

对于体检报告pdf要想提取里边的所有数据用文字识别OCR什么产品比较好？

137

1

0

用户通过前端界面上传 PDF/DOC 等文件如何从OSS获取到上传的文件并进行相应的处理任务？

169

1

0

请问下OSS里存的大写后缀的PDF文件，智能媒体管理是不支持预览吗，只能修改源文件后缀嘛？

223

1

0

钉钉里如何预览PDF格式文件？

579

2

0

需要在钉钉小程序内部预览pdf文件，并且不能上传到钉盘，请问我该怎么做

227

0

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

A2UI 规范与 AG-UI 协议：打造高效协同的界面开发体系

迎宾机器人技术深度解析与主流产品选型指南

NFC护照识读鉴伪解决方案-小程序/app端护照鉴伪

基于 YOLOv8 的智能车牌定位检测系统设计与实现—从模型训练到 PyQt 可视化落地的完整实战方案

实用代码工具：Python打造PDF选区OCR / 截图批量处理工具（支持手动/全自动模式）

热门讨论

热门文章

文字识别OCR目前有哪些情况会导致识别失败？

文字识别OCR怎么做作业&试卷的自动批改？

OCR营业执照识别失败什么原因？

文字识别OCR的图片识别异常相同图片部分机型无法识别，这是为什么？

文字识别OCR识别失败是因为什么？报错 code 464

OCR之前还用的好好的，怎么突然错了？

身份证识别ocr，每次购买需要更换url地址吗？

OCR发票识别不到？

ocr通用文字识别后付费和资源包价格是不一样吗？

文字识别OCR支持图片分类吗？

展开全部

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

阿里云视觉智能开放平台--文字识别使用教程

OCR文字识别技术总结（一）

分析对比大模型OCR、传统OCR和深度学习OCR

从图片提取文字的终极解决方法 ——【通用文字识别 API】

分享：如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用，图片批量识别转excel表格的方法

CRNN文字识别

OCR文字识别方法综述

印刷文字操作报错合集之出现“图片和服务类型不匹配”，该怎么解决

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

展开全部

还有其他疑问?