在文字识别OCR可以识别Word结构化吗？目前支持哪些文件格式呀？支持离线吗？

展开

收起

小小鹿鹿鹿 2023-11-06 15:51:52 207 版权

4 条回答

写回答

取消提交回答

小小杳杳杳

不支持。图片部分接口支持pdf。不支持。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

2023-11-07 22:33:29

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
文字识别OCR可以支持多种文件格式，包括.doc、.docx、.pdf等。
此外，OCR还支持在线和离线两种识别模式：
- 在线模式：实时上传文件到云端进行识别。
- 离线模式：下载OCR SDK，安装到本地服务器，即可实现离线识别。
需要注意的是，在线模式可以节省时间，并具备较高的准确率，而离线模式则可以更快地处理大量文件。
2023-11-07 13:25:15

赞同展开评论
Star时光

是的，阿里云的文字识别OCR可以识别 Word 文档，并支持多种文件格式，包括.docx、.doc、.pdf 等等。如果您需要离线使用OCR，可以下载离线 SDK，通过下载模型实现离线识别。
不过，离线 SDK 不支持所有文件格式，只能支持常见的一些文件格式，因此建议您使用线上服务进行识别。同时，为了更好地识别 Word 文档，可以考虑先将其转换成 PDF 格式，以提高识别准确率

2023-11-06 21:43:38

赞同展开评论
vohelon

支持的。

RecognizeDocumentStructure - 文档结构化识别https://help.aliyun.com/document_detail/447632.html?spm=a2c4g.2261246.0.i8

文档结构化识别。

调试
您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。

调试调试调试
授权信息
下表是API对应的授权信息，可以在RAM权限策略语句的Action元素中使用，用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下：

操作：是指具体的权限点。
访问级别：是指每个操作的访问级别，取值为写入（Write）、读取（Read）或列出（List）。
资源类型：是指操作中支持授权的资源类型。具体说明如下：
对于必选的资源类型，用背景高亮的方式表示。
对于不支持资源级授权的操作，用全部资源表示。
条件关键字：是指云产品自身定义的条件关键字。
关联操作：是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限，操作才能成功。

支持的图片格式
PNG、JPG、JPEG、BMP、GIF、TIFF、WebP
PDF文件格式的文档结构化解析请点击文档智能解析快速了解

2023-11-06 17:13:02

赞同展开评论

在文字识别OCR可以识别Word结构化吗？目前支持哪些文件格式呀？支持离线吗？

文字识别

相关文章

热门讨论

热门文章