开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR中第一个是多行识别成一行了,第二个是长的发票后面的内容就跑第一个里了,怎么解决?

"文字识别OCR中第一个是多行识别成一行了,第二个是长的发票后面的内容就跑第一个里了,第三个是少识别了一行,怎么解决?
bc12da8bcd36537f9bb89331e7995eb5.png
ed09fbf438185208d08c41b0a9ecea33.png
5dc34bcb638c9b8c4ebd75e851669f19.png"

展开
收起
小易01 2023-12-12 22:26:06 123 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    您好,针对您在使用文字识别OCR时遇到的问题,以下是一些建议和解决方法:

    1. 多行识别成一行:这可能是因为OCR技术在处理多行文本时可能出现的误判。为了解决这个问题,您可以尝试使用不同的OCR工具,或者调整输入的图片质量。另外,深度学习时代的文字识别有CRNN算法和attention算法等,它们都在行识别方面表现较好。

    2. 长的发票后面的内容跑到第一个里:这可能是因为OCR在识别过程中没有正确划分文本段落。您可以尝试调整图像的预处理步骤,如进行边缘检测、获取轮廓以及透视变换,以帮助系统更好地识别文本段落。

    3. 少识别了一行:这可能是由于OCR在识别过程中出现了遗漏。为了解决这个问题,您可以考虑重新扫描或调整图片质量。同时,确保发票或其他文档的文字清晰可见,避免因为模糊或其他因素导致的漏识别。

    2023-12-13 16:08:19
    赞同 展开评论 打赏
  • 意中人就是我呀!

    有可能识别错误的,但不能保证完全还原 我这边反馈下,短时间优化不了 需要数据支持如果有的话 也可以提供下。此答案整理至钉群"【官方】阿里云OCR公共云客户交流群"。

    2023-12-13 07:32:18
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载