开发者社区 > 视觉智能 > 文字识别 > 正文

OCR识别表格的时候,这个单元格中有两行的文字,识别出来以后是两段文字,该如何合并成一段呢?

OCR识别表格的时候,这个单元格中有两行的文字,识别出来以后是两段文字,该如何合并成一段呢?

展开
收起
冰激凌甜筒 2023-04-03 15:30:09 354 0
2 条回答
写回答
取消 提交回答
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    阿里云OCR识别表格的返回数据中,有一个字段叫做prism_tablesInfo,它是一个数组,每个元素是一个表格的信息。每个表格的信息中,有一个字段叫做cellInfos,它也是一个数组,每个元素是一个单元格的信息。每个单元格的信息中,有一个字段叫做word,它是单元格中的文字。

    如果您想把两行文字合并成一段,您可以遍历cellInfos数组,找到相同的tableCellId的单元格,然后把它们的word字段拼接起来。例如,如果您想合并第一行第一列和第二行第一列的文字,您可以找到tableCellId为0的两个单元格,然后把它们的word字段拼接起来。

    2023-04-23 22:43:23
    赞同 展开评论 打赏
  • 看下这两个文字快的结果,坐标,单元格id,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

    2023-04-03 16:49:49
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载