开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR图片转Excel的方式,这种有边线的情况下转移出来的Excel 出现跨行了该如何解决?

文字识别OCR 图片转Excel的方式,这种有边线的情况下,转移出来的Excel 出现跨行了,该如何解决?
b2560632a134f88464a84d47c9dc0ed3.png
4b317a6f3b7a11b02c40d3a1f58f375e.png

展开
收起
2401。 2023-08-27 10:03:09 130 0
4 条回答
写回答
取消 提交回答
  • 周围的线条对识别效果产生影响了 不能保证100%完全还原。此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”。

    2023-08-28 20:07:43
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    自定义表格模板是针对固定版式的单页有框线表格表单数据提供的一款定制化产品。用户仅需通过一张模板数据的可视化拖拉拽配置参照字段、识别字段或表头&待识别的列表区域,字段属性等,无需进行数据标注和模型训练,即可实现相同版式数据的自定义结构化识别抽取。经过配置调优的模板识别准确率可达85%以上。
    image.png

    同时工具箱中还提供分类器管理工具与字段类型管理工具,支持用户通过同一接口完成不同版式数据的自动分类路由与高精度识别。image.png
    步骤一 : 上传模板图片
    image.png
    步骤二 : 框选参照字段
    image.png
    步骤三 : 配置识别字段
    image.png
    步骤四 : 模板测试与发布
    image.png

    2023-08-28 09:48:47
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,出现跨行的情况多数是由于OCR识别的时候没有正确地识别表格的边界,或者是表格中数字或文字的行高不同导致的。可以尝试以下几种方法解决:

    1.重新调整原始图片中表格的边界并重新进行OCR识别,这样可能会减少跨行的情况。

    2.手动编辑OCR转换后的Excel文件来纠正跨行的问题,可以通过拆分单元格、调整行高等方式来解决。

    3.使用第三方工具进行Excel文件格式转换,例如使用Python的pandas库或者OpenPyXL库等,可以将OCR转换后的Excel文件进行处理,使其更加符合要求。

    2023-08-28 08:52:41
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    当使用阿里云文字识别OCR将图片转换为Excel时,如果图片中存在边框,并且在转换为Excel后,出现了跨行的情况,可以采取以下几种方法来解决:

    1. 图片预处理:在将图片传给OCR进行识别之前,对图片进行预处理,通过裁剪、调整大小或旋转等操作,使表格边框对齐和显示正确。这样可以提高识别的准确性,并减少出现跨行的问题。

    2. OCR结果后处理:在将OCR识别结果转存为Excel文件之前,对OCR输出的文本进行处理。可以根据表格的行高和列宽信息,对跨行的结果进行合并,使其与原始图片中的表格结构保持一致。

    3. 使用其他工具或库:如果OCR结果转存为Excel的方法无法满足需求,可以考虑使用其他专业的处理表格数据的工具或库,如Python中的pandas库或Java中的Apache POI库。这些工具提供更多的表格处理和合并单元格的功能,可以更好地管理和调整识别结果。

    表格识别和转换是一个复杂的任务,可能会遇到各种不确定因素。在处理跨行和表格结构问题时,需要根据具体的场景和需求进行一些自定义化的处理。

    2023-08-27 23:40:18
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载