在文字识别OCR可以识别Word结构化吗?目前支持哪些文件格式呀?支持离线吗?
文字识别OCR可以支持多种文件格式,包括.doc、.docx、.pdf等。
此外,OCR还支持在线和离线两种识别模式:
需要注意的是,在线模式可以节省时间,并具备较高的准确率,而离线模式则可以更快地处理大量文件。
是的,阿里云的文字识别OCR可以识别 Word 文档,并支持多种文件格式,包括.docx、.doc、.pdf 等等。如果您需要离线使用OCR,可以下载离线 SDK,通过下载模型实现离线识别。
不过,离线 SDK 不支持所有文件格式,只能支持常见的一些文件格式,因此建议您使用线上服务进行识别。同时,为了更好地识别 Word 文档,可以考虑先将其转换成 PDF 格式,以提高识别准确率
支持的。
RecognizeDocumentStructure - 文档结构化识别https://help.aliyun.com/document_detail/447632.html?spm=a2c4g.2261246.0.i8
文档结构化识别。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
调试调试 调试
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
操作:是指具体的权限点。
访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
资源类型:是指操作中支持授权的资源类型。具体说明如下:
对于必选的资源类型,用背景高亮的方式表示。
对于不支持资源级授权的操作,用全部资源表示。
条件关键字:是指云产品自身定义的条件关键字。
关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
支持的图片格式
PNG、JPG、JPEG、BMP、GIF、TIFF、WebP
PDF文件格式的文档结构化解析请点击文档智能解析快速了解
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。