开发者社区 > 视觉智能 > 文字识别 > 正文

在文字识别OCR可以识别Word结构化吗?目前支持哪些文件格式呀?支持离线吗?

在文字识别OCR可以识别Word结构化吗?目前支持哪些文件格式呀?支持离线吗?

展开
收起
小小鹿鹿鹿 2023-11-06 15:51:52 92 0
4 条回答
写回答
取消 提交回答
  • 不支持。图片 部分接口支持pdf。不支持。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

    2023-11-07 22:33:29
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    文字识别OCR可以支持多种文件格式,包括.doc、.docx、.pdf等。
    此外,OCR还支持在线和离线两种识别模式:

    • 在线模式:实时上传文件到云端进行识别。
    • 离线模式:下载OCR SDK,安装到本地服务器,即可实现离线识别。

    需要注意的是,在线模式可以节省时间,并具备较高的准确率,而离线模式则可以更快地处理大量文件。

    2023-11-07 13:25:15
    赞同 展开评论 打赏
  • 是的,阿里云的文字识别OCR可以识别 Word 文档,并支持多种文件格式,包括.docx、.doc、.pdf 等等。如果您需要离线使用OCR,可以下载离线 SDK,通过下载模型实现离线识别。
    不过,离线 SDK 不支持所有文件格式,只能支持常见的一些文件格式,因此建议您使用线上服务进行识别。同时,为了更好地识别 Word 文档,可以考虑先将其转换成 PDF 格式,以提高识别准确率

    2023-11-06 21:43:38
    赞同 展开评论 打赏
  • 支持的。

    RecognizeDocumentStructure - 文档结构化识别https://help.aliyun.com/document_detail/447632.html?spm=a2c4g.2261246.0.i8

    文档结构化识别。

    调试
    您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

    调试调试 调试
    授权信息
    下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

    操作:是指具体的权限点。
    访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
    资源类型:是指操作中支持授权的资源类型。具体说明如下:
    对于必选的资源类型,用背景高亮的方式表示。
    对于不支持资源级授权的操作,用全部资源表示。
    条件关键字:是指云产品自身定义的条件关键字。
    关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。

    支持的图片格式
    PNG、JPG、JPEG、BMP、GIF、TIFF、WebP
    PDF文件格式的文档结构化解析请点击文档智能解析快速了解

    2023-11-06 17:13:02
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载