ocr这个接口的json结果有文字坐标吗？

展开

收起

真的很搞笑 2023-05-30 20:20:32 273 版权

3 条回答

写回答

取消提交回答

游客uj6xec5prhogy

没有，需要的话　可以用高精度识别，此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2023-07-11 15:02:43

赞同展开评论

一位隐者

是的，阿里云OCR接口返回的JSON结果中包含了文字坐标信息。具体来说，在进行印刷体文字识别时，OCR接口会返回文本行（line）和单个字符（word）的位置信息。在返回结果中，每一行都包含了该行的左上角坐标（x、y）、宽度（w）和高度（h），而每一个单个字符都包含了该字符的左上角坐标（x、y）、宽度（w）和高度（h）。

以下是一个示例返回结果，其中“vertices”字段即为文字坐标信息：

{
    "request_id": "xxx",
    "success": true,
    "data": {
        "angle": -1.064153790473938,
        "width": 1920,
        "height": 1080,
        "boxes": [
            {
                "text": "Hello, world!",
                "type": "WORD",
                "score": 0.997,
                "vertices": [
                    {"x": 100, "y": 100},
                    {"x": 200, "y": 100},
                    {"x": 200, "y": 200},
                    {"x": 100, "y": 200}
                ]
            },
            {
                "text": "OpenAI",
                "type": "WORD",
                "score": 0.998,
                "vertices": [
                    {"x": 300, "y": 100},
                    {"x": 400, "y": 100},
                    {"x": 400, "y": 200},
                    {"x": 300, "y": 200}
                ]
            }
        ],
    }
}

在实际开发中，您可以通过解析OCR接口返回的JSON结果，提取文字坐标信息，并根据坐标信息进行相应的后续处理，例如高亮显示识别到的文字区域、裁剪图片、调整文字排版等。

2023-05-31 16:33:30

赞同展开评论

魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

根据阿里云官网提供的ocrSDK使用文档和示例Demo，ocrSDK返回的json结果中没有文字坐标信息。如果您需要获取文字坐标信息，可以自行编写处理代码，或者与阿里云客服联系，咨询相关的API接口和使用方法。问题2：读光体验中心是阿里云推出的一项云上数字阅读服务，提供图书、杂志、漫画等多种电子书的在线阅读服务，可以在线阅读的同时，体验高清、无损、护眼的阅读体验。它不仅支持常见的图片格式，还支持PDF、TXT、CHM、MOBI等多种电子书格式。问题3：阿里云的ocrSDK可以识别表格结构，可以通过设置识别参数来实现对表格内容的识别。具体可以参考阿里云官网提供的相关文档和示例代码。

2023-05-31 15:23:46

赞同展开评论

ocr这个接口的json结果有文字坐标吗？

文字识别

相关文章

热门讨论

热门文章