文字识别OCR调用混贴识别发票类别识别错了，数据都是错误的，是什么原因？

文字识别OCR 发的淘宝支付详情，然后调用混贴识别，识别出来的不是电商详情发票，而是增值税发票，发票类别识别错了没关系，但是数据都是错误的，是什么原因？

展开

收起

2401。 2023-08-27 10:17:48 244 版权

5 条回答

写回答

取消提交回答

六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，根据您提供的图片来看您应该是需要识别出电商详情页中的内容，建议您选择电商详情页场景进行识别，

对于不属于混贴发票场景的图片而选择混贴发票场景进行识别的话，效果往往不会太好，甚至就是错误

2023-08-29 17:51:22

赞同展开评论
挚爱长虹

有可能会识别错的不能保证完全匹配正确。此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”。

2023-08-28 20:15:34

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

感觉没有按照官方文档步骤做，可以看一下相关介绍，阿里云混贴发票识别，是阿里云官方自研OCR文字识别产品，适用于获取多种发票集合在一个页面的场景，需要获取多种发票上的关键信息。
阿里云OCR产品基于阿里巴巴达摩院强大的AI技术及海量数据，历经多年沉淀打磨，具有服务稳定、操作简易、实时性高、能力全面等几大优势。

使用步骤

重要提示

2023-08-28 12:27:49

赞同展开评论
三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，可能有多种原因导致阿里云文字识别OCR识别出错，以下是一些可能的原因：
1. 图片质量较差：文字识别OCR需要较高的图片质量才能准确地识别，如果图片过于模糊或者有噪点，会影响识别效果。
2. 字体问题：如果图片中的字体太小或者太过花式，也容易导致识别错误。
3. 识别算法问题：阿里云文字识别OCR使用的识别算法可能存在漏洞或者缺陷，导致识别效果不佳。
4. 数据标注问题：训练模型的数据集标注错误或者不够全面也会导致识别结果不准确。
综合以上几点可能的原因，建议尝试优化图片质量、使用更加准确稳定的字体以及调整算法参数等方式来提高识别效果。
2023-08-28 09:09:02

赞同展开评论
wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
阿里云文字识别OCR在处理淘宝支付详情时，如果将其作为混贴识别的输入，可能会导致识别结果不准确或错误。这可能是由于以下原因所致：
1. 混贴识别适用范围不同：混贴识别是用于处理多页或多种发票类型的情况，它会尝试从混合的发票图像中识别出不同类型的发票。然而，淘宝支付详情的格式和内容与传统的增值税发票等发票类型可能存在较大差异，不太适用于混贴识别的场景。
2. 模型训练的差异：阿里云文字识别OCR的模型训练基于大量的数据集，但是针对不同的发票类型，模型的训练数据可能存在差异。这可能导致模型在处理淘宝支付详情时识别结果不准确或错误。
3. 图像质量和内容差异：淘宝支付详情的图像质量和内容可能与传统发票不同，可能存在更多的变化和复杂性。这可能会对OCR的识别结果产生影响，导致数据错误或不准确。
2023-08-27 23:47:27

赞同展开评论

文字识别OCR调用混贴识别发票类别识别错了，数据都是错误的，是什么原因？

文字识别

相关文章

热门讨论

热门文章