开发者社区 > 视觉智能 > 文字识别 > 正文

ocr这个接口的json结果有文字坐标吗?

ocr这个接口的json结果有文字坐标吗?image.png

展开
收起
真的很搞笑 2023-05-30 20:20:32 157 0
3 条回答
写回答
取消 提交回答
  • 没有,需要的话 可以用高精度识别,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

    2023-07-11 15:02:43
    赞同 展开评论 打赏
  • 是的,阿里云OCR接口返回的JSON结果中包含了文字坐标信息。具体来说,在进行印刷体文字识别时,OCR接口会返回文本行(line)和单个字符(word)的位置信息。在返回结果中,每一行都包含了该行的左上角坐标(x、y)、宽度(w)和高度(h),而每一个单个字符都包含了该字符的左上角坐标(x、y)、宽度(w)和高度(h)。

    以下是一个示例返回结果,其中“vertices”字段即为文字坐标信息:

    {
        "request_id": "xxx",
        "success": true,
        "data": {
            "angle": -1.064153790473938,
            "width": 1920,
            "height": 1080,
            "boxes": [
                {
                    "text": "Hello, world!",
                    "type": "WORD",
                    "score": 0.997,
                    "vertices": [
                        {"x": 100, "y": 100},
                        {"x": 200, "y": 100},
                        {"x": 200, "y": 200},
                        {"x": 100, "y": 200}
                    ]
                },
                {
                    "text": "OpenAI",
                    "type": "WORD",
                    "score": 0.998,
                    "vertices": [
                        {"x": 300, "y": 100},
                        {"x": 400, "y": 100},
                        {"x": 400, "y": 200},
                        {"x": 300, "y": 200}
                    ]
                }
            ],
        }
    }
    

    在实际开发中,您可以通过解析OCR接口返回的JSON结果,提取文字坐标信息,并根据坐标信息进行相应的后续处理,例如高亮显示识别到的文字区域、裁剪图片、调整文字排版等。

    2023-05-31 16:33:30
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    根据阿里云官网提供的ocrSDK使用文档和示例Demo,ocrSDK返回的json结果中没有文字坐标信息。如果您需要获取文字坐标信息,可以自行编写处理代码,或者与阿里云客服联系,咨询相关的API接口和使用方法。 问题2:读光体验中心是阿里云推出的一项云上数字阅读服务,提供图书、杂志、漫画等多种电子书的在线阅读服务,可以在线阅读的同时,体验高清、无损、护眼的阅读体验。它不仅支持常见的图片格式,还支持PDF、TXT、CHM、MOBI等多种电子书格式。 问题3:阿里云的ocrSDK可以识别表格结构,可以通过设置识别参数来实现对表格内容的识别。具体可以参考阿里云官网提供的相关文档和示例代码。

    2023-05-31 15:23:46
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载