开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别ocr中我们的需求是要识别 pdf 中的内容,包含文本,图片以及图片格式的表格哪个合适呢?

文字识别ocr中我们的需求是要识别 pdf 中的内容,包含文本,图片以及图片格式的表格,图片可能是横向的。哪个接口更合适呢?9f3a0b6e27361385c7a13bace9b90917.jpg类似与这样的 pdf 文件。

展开
收起
小小鹿鹿鹿 2023-11-20 21:57:20 82 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    文字识别 OCR 提供几种不同的识别方案,包括文本识别、图片识别和表格识别。
    对于 PDF 文件中的内容,可以根据不同的需求选用相应的 OCR 方案,一般情况下可以采用以下方法:

    1. 文本识别:适用于 PDF 文件中的文本。
    2. 图片识别:适用于 PDF 文件中的图片内容。
    3. 表格识别:适用于 PDF 文件中的表格。

    此外,文字识别 OCR 可以智能识别 PDF 文件中的表格内容,并返回表格结构信息。
    最后,在使用文字识别 OCR 解决 PDF 文件的文本、图片和表格时,应根据实际需要选取相应的方案。

    2023-11-21 21:51:21
    赞同 1 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,看了你的问题,阿里云OCR中的pdf表格识别pdf文档识别接口可能更适合你。

    pdf表格识别接口可以识别 PDF 中的表格,支持表格中包含文字和图片。

    pdf文档识别接口可以识别 PDF 中的文字和图片,包括横向的图片。

    这里,你可以根据实际情况选择使用相应的接口。

    2023-11-20 22:08:17
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载