开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR长pdf文档识别(论文\财报等),适合开通通用文字识别中的哪种?

文字识别OCR长pdf文档识别(论文\财报等),适合开通通用文字识别中的哪种?

展开
收起
青城山下庄文杰 2023-07-31 08:45:11 110 0
6 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    如果您需要识别长PDF文档,建议开通阿里云通用文字识别(OCR)中的“PDF识别”功能。PDF识别功能可以自动检测文档中的文本和表格,并进行结构化识别和提取。在处理长PDF文档时,PDF识别功能可以将多个PDF页合并成一个文档,并进行分页和排版处理,以便于后续的文本识别和分析。

    在使用PDF识别功能时,建议您注意以下几点:

    根据文档特点选择适当的识别模式:PDF识别功能支持多种识别模式,包括自动、表格、文本等模式。根据文档的特点和需求,选择适当的识别模式可以获得更好的识别效果。

    根据文档大小和结构设置适当的参数:PDF识别功能提供了多种参数设置选项,包括页码范围、分辨率、语言、表格检测等。根据文档的大小和结构,设置适当的参数可以提高识别准确率和效率。

    进行后续的文本清洗和分析:识别完成后,需要对识别结果进行后续的文本清洗和分析,以确保识别结果的准确性和可靠性。同时,需要根据具体需求和应用场景,进行相应的文本处理和分析,以获得更好的效果。

    2023-07-31 21:19:35
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。
    2023-07-31 17:57:07
    赞同 展开评论 打赏
  • 十年摸盘键,代码未曾试。 今日码示君,谁有上云事。

    阿里云全文识别高精版,是阿里云官方自研OCR文字识别产品,智能识别图片所包含的全部字段,集表格识别、旋转识别、生僻字识别等多功能为一体,提供高性价比的多场景文字识别体验。

    在通用文字识别(标准版)的基础上,提供更高精度的识别服务,支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语),并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字。

    标准版:

    对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等10种语言,并支持中、英、日、韩四语种的类型检测。

    高精度含位置版:

    在通用文字识别(高精度版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理。

    标准含位置版:

    在通用文字识别(标准版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理。

    2023-07-31 10:18:03
    赞同 1 展开评论 打赏
  • 热爱开发

    通用文字识别服务支持识别多种文档类型,包括但不限于论文、财报、合同、报告、书籍等。如果您需要对长PDF文档进行文字识别,可以选择开通通用文字识别服务中的“高精度模型”或“超高精度模型”,这些模型针对长文档、表格、图片等场景进行了优化,识别精度更高。具体选择哪种模型,可以根据您的需求和预算进行选择。如果您对识别精度要求较高,可以选择“超高精度模型”,如果您对成本敏感,可以选择“高精度模型”。

    2023-07-31 09:08:53
    赞同 展开评论 打赏
  • 要识别长PDF文档中的文字,您可以考虑使用阿里云通用文字识别(General OCR)服务中的"OCR识别"功能。这个功能适用于各种类型的文字识别需求,包括论文、财报等。

    通用文字识别(OCR)服务提供了多种API接口和SDK,以便您将PDF文档传输到阿里云进行文字识别。以下是一些步骤和注意事项:

    1. 开通通用文字识别服务:如果还没有开通通用文字识别服务,请登录到阿里云控制台,导航到通用文字识别(OCR)服务页面,并按照指引开通相应的服务。

    2. 获取API密钥:在阿里云控制台的"AccessKey管理"页面获取您的Access Key ID和Access Key Secret。这将用于向API进行身份验证。

    3. 选择合适的API或SDK:根据您的需求,选择适合的API或SDK来调用通用文字识别服务。您可以参考阿里云官方文档,了解如何使用API或SDK进行OCR识别操作。

    4. 提交长PDF文档进行识别:将您的长PDF文档上传到阿里云,并通过API或SDK提交识别请求。这可能需要分片处理或使用异步方式,以应对大型文档的处理。

    5. 解析识别结果:一旦识别请求完成,您将获得一个包含文本内容的识别结果。您可以根据需要进行后续处理,例如提取关键信息、导出到其他格式等。

    请注意,长PDF文档的识别可能需要较长的时间和更复杂的处理步骤。您可能需要调整API参数、分片处理或使用异步方式来处理大型文档。

    2023-07-31 09:01:42
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,阿里云通用文字识别可以识别多页PDF文档,但免费版只支持单页识别,需要开通付费版。对于长pdf文档的识别,推荐选择文档识别(Document Recognition)产品,因为它支持自动拆分PDF文档和识别表格等复杂结构,适用于论文、财报等格式复杂的文档识别。

    2023-07-31 08:57:51
    赞同 展开评论 打赏
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载