文档备案控制台

开发者社区视觉智能文字识别正文

文字识别OCR 给出来的所有识别出来的文字的坐标都是错的，要怎么解决？

文字识别OCR 给出来的所有识别出来的文字的坐标都是错的，要怎么解决？

这张图，“营业执照”这四个字的坐标如下：

按照这个坐标在原图上画框，位置是错的，如图红框

但是在线的demo里很明显看到，矫正后的图片，上面的国徽都少了半个，这个返回的坐标是不是按照矫正后的图片算的

展开

收起

嘟嘟嘟嘟嘟嘟 2024-02-06 21:28:16 464 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
要解决文字识别OCR给出的所有识别出来的文字的坐标错误的问题，可以采取以下几种方法：
1. 优化图像质量：确保输入OCR系统的图像清晰度高，对比度适中，没有模糊或扭曲，因为图像质量直接影响识别准确性。如果原始图像区域太小或模糊，可能会导致识别出的文字内容错误较多。
2. 调整识别设置：大多数OCR软件都提供了调整识别参数的选项，比如识别模式、语言、字符集等。根据文档的具体特征调整这些设置，可以提高识别的准确性。
3. 使用先进的OCR技术：考虑使用一些先进的OCR工具或服务，如EasyOCR，它使用PyTorch作为后端处理程序，支持多种语言检测，并且在准确性上更可靠。
4. 检查文字摆放方式：如果文字摆放不是横平竖直，会增加识别的难度。在这种情况下，可能需要预处理图像，比如进行旋转校正，以确保文字方向正确。
5. 利用置信度评估：一些OCR系统会提供每个识别字符的置信度评分。这个置信度可以表征识别错误的可能性。通过设置阈值过滤掉低置信度的识别结果，可以提高整体的识别准确率。
6. 后处理校验：在OCR识别后，可以采用一些文本校验算法，如拼写检查、语法检查等，来纠正可能的错误。
7. 人工复核：对于关键信息，可以增加人工复核环节，确保识别结果的准确性。
8. 技术支持：如果问题依然存在，可以联系OCR服务提供商的技术支持团队，他们可能会提供专业的解决方案或直接对问题进行调查。
9. 持续学习和优化：如果使用的是自定义OCR模型，可以通过不断收集错误样本并进行模型训练，逐步提高模型的识别准确性。
10. 多工具对比：可以尝试使用不同的OCR工具或服务进行对比，选择最适合当前文档类型的识别工具。
综上所述，通过上述方法，您应该能够有效解决OCR文字识别中的坐标错误问题，提高识别结果的准确性。
2024-02-07 14:05:14

赞同展开评论
番茄酱脑袋

校正后的图片可以通过sliceRect 的坐标获取。此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2024-02-06 21:54:05

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

印刷文字识别文字识别文字识别ocr 印刷文字识别文字印刷文字识别ocr 文字识别印刷文字识别文字

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

调用【身份证OCR文字】接口返回403(Forbidden)

315

0

0

文字识别OCR标注中心这里进去报错了，怎么解决？

235

1

0

文字识别OCR如果上传做训练的标注集里面有图片有问题，想不做标注，废弃处理。该怎么操作？

212

1

0

文字识别OCR如果是公司使用，是不是开通对公 AccessKey 账号？

215

2

0

文字识别OCR增值税发票识别可以实现多个发票识别嘛？

225

2

0

文字识别OCR文档智能可以做“供应商资质的智能审核”吗？

185

2

0

在文字识别OCR需要创建一个子账号给同事维护模板数据，请问需要给他什么权限？

160

1

0

文字识别OCR想知道的那个body没有在里体现出来？

118

1

0

文字识别OCR这里面还url，就是网络图片能请求成功，但是换成body就是不对，怎么回事？

190

1

0

如何查询OCR文字识别共享资源包的剩余量？

207

2

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

谷歌 Gemma 4 深度解析：256K 超长上下文与 MoE 架构，开源大模型正式步入“性能巅峰”时代？

Token百科：什么是Token？以及Token收费价格计费规则，以阿里云为例免费送7000万Tokens

公司迁云上阿里云？阿里云有哪些活动政策补贴？看完这篇文章就知道了

企业迁云必看！阿里云企业上云补贴政策：5 亿算力 + 10 万出海扶持全汇总

阿里云Tokens免费领取：新用户7000万Tokens+企业万亿扶持，附最新计费标准

热门讨论

热门文章

OCR之前还用的好好的，怎么突然错了？

文字识别OCR看recognizeInvoice的文档，识别成功code为啥是null？

文字识别ocr支持android吗，android sdk文档链接有不？

文字识别OCR目前有哪些情况会导致识别失败？

身份证识别ocr，每次购买需要更换url地址吗？

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

在文字识别OCR有做过越南身份证识别的吗？越南的都是12位的吗？

文字识别OCR现在有pdf识别发票的接口吗？

在文字识别OCR中，在微信小程序里面调用ocr识别失败这是什么原因？

OCR有没有c#调用票据识别示例？网页上面的调用不成功。难道要买了才可以调试吗？

展开全部

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

图像文字识别(OCR)用什么算法小结

吴恩达《机器学习》课程总结（18）应用实例：图片文字识别

阿里云视觉智能开放平台--文字识别使用教程

OCR文字识别技术总结（一）

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

分享：如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用，图片批量识别转excel表格的方法

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

分析对比大模型OCR、传统OCR和深度学习OCR

展开全部

还有其他疑问?