开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR图片表格识别,被合并的单元格,如何确定该项是所属那一行?

文字识别OCR图片表格识别,被合并的单元格,如何确定该项是所属那一行?例如:5680a8a371ff1fb8acea2b7d5be2d11c.png
,我想要一组json ,想知道那些课属于上午,最好就是每节课的json中包含“上午”类似的被合并的单元格

展开
收起
三分钟热度的鱼 2023-09-13 19:16:55 247 0
5 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,文字识别OCR主要是识别图片内容为可编辑的内容,返回xml或者json的格式,您可以尝试表格识别
    image.png
    看返回的json数据是否满足您的要求,或者也可以尝试表格智能解析
    image.png
    另外json中具体内容的解析需要您自行解析。

    2023-09-14 18:21:16
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    image.png

    在文字识别OCR中进行表格识别时,如果存在被合并的单元格,可以尝试以下方法来确定该项所属的行:
    image.png

    1. 基于单元格边界框:OCR通常会返回每个检测到的单元格的边界框信息。您可以使用这些边界框信息来判断单元格所属的行。通过比较单元格的上边界和下边界与其他单元格的位置关系,可以推断出单元格所在的行。

    2. 基于行号标记:有些OCR工具或算法在表格识别过程中可能会尝试将每个单元格与其所在的行关联起来,并为每个单元格分配一个行号。您可以查看OCR结果中是否提供了行号标记,以确定被合并的单元格所属的行。

    3. 基于文本内容:通过分析被合并单元格内部的文本内容,可以根据其他单元格的内容推断出所属的行。例如,您可以查看被合并单元格之前或之后的单元格的内容,并将其与被合并单元格的内容进行比较来确定所属的行。

    4. 上下文信息:考虑上下文信息也是一种判断合并单元格所属行的方式。观察表格的整体结构、布局和其他已知的信息,例如表头、列标题等,可以帮助您推断出被合并单元格所属的行。

    需要注意的是,处理被合并的单元格可能涉及到一些复杂的逻辑和算法。最终的准确性取决于OCR工具和算法的质量,以及表格的特征和结构。对于复杂的表格,可能需要进一步的处理和分析,使用更高级的算法或手动干预来确定合并单元格的行归属关系。

    2023-09-14 13:25:29
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,在阿里云文字识别OCR图片表格识别中,被合并的单元格可以通过表格的结构信息进行解析。通常情况下,被合并的单元格可以通过相邻字段的边框信息推算出所属的行和列。

    具体实现方法可以参考以下步骤:

    1. 使用表格检测功能对表格进行检测,获取表格的位置和结构信息。

    2. 根据表格结构信息,将表格转换成一个二维矩阵。

    3. 根据每个单元格的坐标和边框信息,确定每个单元格所处的行和列。

    4. 对于被合并的单元格,根据相邻单元格的边框信息,推算出该单元格所属的行和列。

    5. 将每个单元格的内容和所属的行列信息保存到输出结果中。

    需要注意的是,对于复杂的表格结构和合并单元格的情况,可能会出现解析不准确的情况。此时可以通过手动调整输出结果来进行修正。

    2023-09-14 07:51:43
    赞同 展开评论 打赏
  • image.png

    确定被合并的单元格所属的行通常需要根据表格的结构和上下文进行推断。以下是一些方法可以帮助您确定被合并的单元格所属的行:
    image.png

    1. 行间距信息:检查表格中其他非合并单元格的行间距信息。通过分析行与行之间的垂直距离,可以推断出被合并的单元格可能属于哪一行。

    2. 列宽信息:观察表格的列宽信息,如果被合并的单元格在某一列中占据较大的宽度,那么可以假设该项属于该列所在的行。

    3. 文本内容连续性:对于跨越多行的被合并单元格,尝试通过识别其文本内容的连续性来确定所属的行。可以考虑使用文本行识别算法或自然语言处理技术来处理文本内容。

    4. 上下文关系:观察被合并单元格周围的其他单元格的内容和位置,尤其是相邻的非合并单元格。根据上下文关系,可以推测出被合并单元格所属的行。

    5. 标记或边框:有些表格中,被合并的单元格可能会有特殊的标记或边框来指示其所属的行。检查表格是否有类似的标记或边框,以确定所属的行。

    2023-09-13 21:22:42
    赞同 展开评论 打赏
  • 这个需要自己根据接口返回的数据来处理的 。此回答整理自钉群“阿里云读光OCR客户交流反馈群 1”

    2023-09-13 19:26:47
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载