开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR中,返回出来的文字块对象比文档多了几个值,分别代表了什么?

文字识别OCR中,用了高精版OCR文字识别/图像识别/图片识别,返回出来的文字块对象比文档多了几个值,分别代表了什么a1f7c1203bd3cf3885b738f4683a7430.png
实际请求里文字块里每个对象下面除了文档里的word,prob,pos之外还有"direction": 0,
"angle": 0,
"x": 38,
"y": 33,
"width": 98,
"height": 42

展开
收起
wenti 2024-05-27 11:16:37 42 0
2 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,在阿里云的文字识别(OCR)服务返回的数据中,这些字段的含义如下:

    direction: 表示文字的行方向。0通常表示文字是从左到右排列的,其他值可能表示不同方向的文本行。
    angle: 表示文字块的旋转角度。0表示文字块是正向的,不倾斜。如果图片中的文字有角度,这个值会表示文字块相对于水平线的角度。
    x: 表示文字块在图像中的左边缘坐标。
    y: 表示文字块在图像中的上边缘坐标。
    width: 表示文字块的宽度。
    height: 表示文字块的高度。
    文档中部分字段没有说明
    image.png
    参考文档:文档

    2024-05-27 18:01:14
    赞同 展开评论 打赏
  • 1e6abbc489a271e932b4f4afb1c37a43.png

    https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-recognizeadvanced?spm=a2c4g.11186623.0.0.bbc821bc0R0xsA——该回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

    2024-05-27 11:48:56
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载