开发者社区 > 视觉智能 > 文字识别 > 正文

在文字识别ocr中,ocr接口返回的数据中valuePos 对应的坐标不是在原图上的是为什么?

在文字识别ocr中,ocr接口返回的数据中valuePos 对应的坐标不是在原图上的,方便说一下,这个坐标要如何变换,能反应到原图上呢?使用的是 机动车注册登记证识别 接口,现在返回的坐标疑似是进行过图片矫正后的坐标。api文档写的确实是原图中的坐标,但是实际上不是,用坐标在原图中找的位置都有偏移,使用子图的话,有些图大概能对上,但是有些图对不上,从框出的位置来看,怀疑是对子图又进行过矫正。7402866da977ce56d7b0124fde53b56c.png

展开
收起
小小鹿鹿鹿 2023-10-30 19:08:28 63 0
3 条回答
写回答
取消 提交回答
  • 是在原图中的坐标。add26e7d40477709c7032946d2c5d345.png此回答来自钉群【官方】阿里云OCR公共云客户交流群。

    2023-10-31 22:07:53
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    一般来说,OCR 服务可能会对输入图片进行校正或裁剪等预处理操作,因此返回坐标可能存在偏差。
    如果您想将坐标恢复到原始图像的位置,请参考以下步骤:

    1. 使用 OCR 服务的原图,还原预处理操作。这包括旋转、缩放、裁剪等;
    2. 对于矫正后的坐标,将其变换到原始图像的空间中。可以使用透视变换、仿射变换或相似变换等方式来完成;
    3. 在变换过程中,确保保持尺寸的比例和坐标系的统一;
    4. 最后,确保数据的一致性和准确性。
    2023-10-31 15:01:03
    赞同 展开评论 打赏
  • 在OCR识别中,ValuePos表示的是识别结果在原始图像中的位置。如果ValuePos的坐标不是在原图上的,那么可能是以下几种情况:

    1. 图像预处理:在进行OCR识别之前,可能对图像进行了预处理,例如旋转、缩放、裁剪等,这可能导致原图的坐标系发生变化。

    2. 图像分割:如果图像被分割成多个子图进行识别,那么每个子图的坐标系可能与原图不同。

    3. 图像矫正:如果图像存在倾斜、旋转等问题,可能需要先进行图像矫正,这也可能导致坐标系发生变化。

    对于这种情况,你可以尝试以下方法:

    1. 获取原始图像:如果可以的话,尽量获取原始图像,然后根据原始图像的坐标系进行调整。

    2. 图像配准:如果有多个子图,可以尝试进行图像配准,使得所有子图的坐标系一致。

    3. 坐标变换:如果已知坐标变换关系,可以进行坐标变换,将坐标转换到原图坐标系。

    4. 使用机器学习:如果可能的话,可以使用机器学习的方法,通过学习大量的样本,自动纠正坐标偏移。

    2023-10-31 14:52:55
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载