开发者社区 > 视觉智能 > 文字识别 > 正文

ocr表格识别返回的json结果,转成excel,这个转化有对应的逻辑代码吗?因为我们同时需要使用文

问题1:ocr表格识别返回的json结果,转成excel,这个转化有对应的逻辑代码吗?因为我们同时需要使用文本框坐标信息和excel形式的数据 问题2:那我怎么才能得到这两种类型的数据呢

展开
收起
真的很搞笑 2023-05-10 23:10:39 380 0
3 条回答
写回答
取消 提交回答
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    问题1:将 OCR 表格识别的 JSON 结果转化为 Excel,可以使用一些开源的 Java Excel 库来实现,比如 Apache POI 或 JExcelAPI 等。您可以根据自己的需求选择相应的库进行转化。具体的转化逻辑需要根据您的 JSON 结果和 Excel 格式进行定制化开发。

    问题2:如果您需要同时获取 OCR 表格识别的文本框坐标信息和 Excel 形式的数据,可以在调用 OCR 表格识别接口时,设置输出格式为 xlsx,这样返回的结果中就包含了表格的文本框坐标信息和 Excel 格式的数据。如果您需要获取更详细的文本框坐标信息,可以在调用 OCR 表格识别接口时,设置输出格式为 json,这样返回的结果中就包含了每个单元格的文本框坐标信息。然后,您可以使用上述方法将 JSON 结果转化为 Excel 格式。

    2023-05-13 23:39:02
    赞同 展开评论 打赏
  • 回答一:

    将OCR表格识别返回的JSON结果转换成Excel需要进行以下几个步骤:

    解析JSON数据:使用编程语言中的JSON解析库将OCR识别接口返回的JSON数据解析成字典或者对象。

    提取表格信息:根据解析后得到的数据结构,提取表格中的每一行和每一列,同时还需注意是否有合并单元格、表头等特殊情况。

    按照Excel格式组织数据:将提取出来的表格信息按照Excel的格式组织,例如每一行变成一条记录,每一列对应一个字段等。

    写入Excel文件:使用Excel操作库,例如openpyxl或者xlwt,将组织后的数据写入到Excel文件中,生成表格数据。

    需要注意的是,将OCR识别接口返回的文本框坐标信息和Excel形式的数据结合在一起可能需要做一些自定义的处理,具体实现方式需要根据具体场景而定。

    回答二:

    获取OCR识别接口返回的JSON数据可以使用API调用或者sdk等方式进行。通常,OCR识别接口中会返回文本框坐标信息和表格中每个单元格的内容和位置信息等数据。对于文本框坐标信息,可以将其保存为JSON格式或者CSV格式的文件;对于表格数据,可以按照上面提到的方法将其转换成Excel文件。在这个过程中,需要注意将文本框坐标信息和表格数据进行匹配。

    2023-05-11 08:31:27
    赞同 展开评论 打赏
  • 问题1:阿里云OCR表格识别返回的JSON结果转成Excel的逻辑代码可以通过使用Python的pandas库实现。pandas是一个开源的数据分析库,可以用于数据的清洗、处理和分析等。将JSON结果转化为DataFrame格式后,可以使用pandas提供的to_excel方法将数据保存为Excel文件。同时,根据需要,可以将文本框坐标信息添加为DataFrame的一列,以便后续使用。

    问题2:获取阿里云OCR表格识别的JSON结果可以使用阿里云提供的API进行请求获取。在请求API时,可以通过参数指定需要识别的图片、识别格式和识别参数等。获取到JSON结果后,按照上述方法转化为DataFrame格式,再进行Excel保存。同时,也可以使用JSON解析工具将JSON结果转化为Python对象,再进行处理。

    2023-05-11 08:00:24
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载