文字识别OCR长pdf文档识别(论文\财报等),适合开通通用文字识别中的哪种？

展开

收起

青城山下庄文杰 2023-07-31 08:45:11 262 版权

6 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

如果您需要识别长PDF文档，建议开通阿里云通用文字识别（OCR）中的“PDF识别”功能。PDF识别功能可以自动检测文档中的文本和表格，并进行结构化识别和提取。在处理长PDF文档时，PDF识别功能可以将多个PDF页合并成一个文档，并进行分页和排版处理，以便于后续的文本识别和分析。

在使用PDF识别功能时，建议您注意以下几点：

根据文档特点选择适当的识别模式：PDF识别功能支持多种识别模式，包括自动、表格、文本等模式。根据文档的特点和需求，选择适当的识别模式可以获得更好的识别效果。

根据文档大小和结构设置适当的参数：PDF识别功能提供了多种参数设置选项，包括页码范围、分辨率、语言、表格检测等。根据文档的大小和结构，设置适当的参数可以提高识别准确率和效率。

进行后续的文本清洗和分析：识别完成后，需要对识别结果进行后续的文本清洗和分析，以确保识别结果的准确性和可靠性。同时，需要根据具体需求和应用场景，进行相应的文本处理和分析，以获得更好的效果。

2023-07-31 21:19:35

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

您好，可以使用文档智能。https://help.aliyun.com/document_detail/450017.html?spm=5176.smartservice_service_robot_chat_new.0.0.2c36709a1SM44D

2023-07-31 17:57:07

赞同展开评论
飞云觅宙

十年摸盘键，代码未曾试。今日码示君，谁有上云事。

阿里云全文识别高精版，是阿里云官方自研OCR文字识别产品，智能识别图片所包含的全部字段，集表格识别、旋转识别、生僻字识别等多功能为一体，提供高性价比的多场景文字识别体验。

在通用文字识别（标准版）的基础上，提供更高精度的识别服务，支持更多语种识别（丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语），并将字库从1w+扩展到2w+，能识别所有常用字和大部分生僻字。

标准版：

对图片中的文字进行检测和识别，支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等10种语言，并支持中、英、日、韩四语种的类型检测。

高精度含位置版：

在通用文字识别（高精度版）的基础上，返回文字在图片中的位置信息，方便进行版式的二次处理。

标准含位置版：

在通用文字识别（标准版）的基础上，返回文字在图片中的位置信息，方便进行版式的二次处理。

2023-07-31 10:18:03

赞同 1 展开评论
祁符建

热爱开发

通用文字识别服务支持识别多种文档类型，包括但不限于论文、财报、合同、报告、书籍等。如果您需要对长PDF文档进行文字识别，可以选择开通通用文字识别服务中的“高精度模型”或“超高精度模型”，这些模型针对长文档、表格、图片等场景进行了优化，识别精度更高。具体选择哪种模型，可以根据您的需求和预算进行选择。如果您对识别精度要求较高，可以选择“超高精度模型”，如果您对成本敏感，可以选择“高精度模型”。

2023-07-31 09:08:53

赞同展开评论
Star时光
要识别长PDF文档中的文字，您可以考虑使用阿里云通用文字识别（General OCR）服务中的"OCR识别"功能。这个功能适用于各种类型的文字识别需求，包括论文、财报等。

通用文字识别（OCR）服务提供了多种API接口和SDK，以便您将PDF文档传输到阿里云进行文字识别。以下是一些步骤和注意事项：
1. 开通通用文字识别服务：如果还没有开通通用文字识别服务，请登录到阿里云控制台，导航到通用文字识别（OCR）服务页面，并按照指引开通相应的服务。
2. 获取API密钥：在阿里云控制台的"AccessKey管理"页面获取您的Access Key ID和Access Key Secret。这将用于向API进行身份验证。
3. 选择合适的API或SDK：根据您的需求，选择适合的API或SDK来调用通用文字识别服务。您可以参考阿里云官方文档，了解如何使用API或SDK进行OCR识别操作。
4. 提交长PDF文档进行识别：将您的长PDF文档上传到阿里云，并通过API或SDK提交识别请求。这可能需要分片处理或使用异步方式，以应对大型文档的处理。
5. 解析识别结果：一旦识别请求完成，您将获得一个包含文本内容的识别结果。您可以根据需要进行后续处理，例如提取关键信息、导出到其他格式等。
请注意，长PDF文档的识别可能需要较长的时间和更复杂的处理步骤。您可能需要调整API参数、分片处理或使用异步方式来处理大型文档。
2023-07-31 09:01:42

赞同展开评论
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，阿里云通用文字识别可以识别多页PDF文档，但免费版只支持单页识别，需要开通付费版。对于长pdf文档的识别，推荐选择文档识别（Document Recognition）产品，因为它支持自动拆分PDF文档和识别表格等复杂结构，适用于论文、财报等格式复杂的文档识别。

2023-07-31 08:57:51

赞同展开评论

滑动查看更多

文字识别OCR长pdf文档识别(论文\财报等),适合开通通用文字识别中的哪种？

文字识别

相关文章

热门讨论

热门文章