备案控制台

开发者社区视觉智能文字识别正文

文字识别OCR里想要使用OCR识别页面图片，支持按照k-v形式返回吗？

文字识别OCR里想要使用OCR识别页面图片，支持按照k-v形式返回吗？

展开

收起

小小鹿鹿鹿 2024-01-10 07:52:56 130 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

3 条回答

写回答

取消提交回答

sunrr
阿里云文字识别OCR服务确实支持将识别结果以键值对（key-value）的形式返回，这在API接口文档中有所说明。

当您使用OCR服务进行页面图片文字识别时，接口返回的结果通常是一个字典，其中包含了多个键值对，这些键值对代表了识别出的文字块及其对应的位置坐标信息。例如，返回的结果可能类似于下面这样：
```
{
    "content": "这里是识别出的文本内容",
    "location": {
        "x": 坐标值,
        "y": 坐标值
    }
}
```
在这个例子中，content键对应的值是识别出的文本内容，而location键则提供了一个字典，包含了文字块的横坐标（x）和纵坐标（y）。这样的结构使得您能够明确知道每个文字块的位置信息，从而可以进行进一步的定位和处理。

需要注意的是，不同的OCR服务功能和应用场景可能会影响返回结果的完整性和细节。例如，某些服务可能只提供文字内容而没有位置信息，或者位置信息不是以字典形式返回。因此，在具体使用时，建议您查阅阿里云文字识别的API参考文档，了解您所使用的API接口的确切返回值。

此外，对于开发过程中的环境配置、API调用等问题，阿里云也提供了详细的开发参考和SDK以帮助开发者更快地上手和使用OCR服务。如果您是RPA开发者，还可以参考阿里云提供的机器人流程自动化（Robotic Process Automation, RPA）解决方案，其中包含了与OCR服务相结合的流程示例和组件，以便您更好地将OCR集成到自动化流程中。
2024-01-13 11:47:35

赞同展开评论
小小杳杳杳

支持的用自学习。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

2024-01-10 14:46:57

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

是的，阿里云的文字识别OCR服务支持按照k-v形式返回识别结果。在您使用该服务进行页面图片的OCR识别时，可以指定输出格式为JSON，这样就可以得到一个k-v形式的返回结果。具体来说，每个识别出的字段都会被标记为一个键（key），对应的识别结果则为值（value）。这样的返回形式便于后续的信息提取和处理。如果您需要进一步了解如何使用该服务或具体的操作步骤，可以参考阿里云官方文档或者联系他们的技术支持团队获取详细信息。

2024-01-10 14:04:50

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

文字识别ocr识别文字识别ocr 印刷文字识别文字识别 ocr印刷文字识别印刷文字识别ocr

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

OCR入参图片链接不支持 OSS 带有效时间的图片链接？

172

2

0

文字识别OCR 识别发票是不是只能一张一张的识别，多张发票在一个图片里也只能识别一张是吗？

209

2

0

文字识别OCR 识别过路费，怎么识别不了？

109

2

0

文字识别OCR比如我截图一张excel图片，目的是想把识别到同一行的内容当作一行来输出可以吗？

113

2

0

文字识别OCR如果是excel图片，如何让OCR识别出来的内容按行输出呢？

219

2

0

文字识别OCR有支持外国人永久居留证的OCR识别计划吗？

104

2

0

文字识别OCR识别身份证正反面这个返回结果是什么原因？

164

2

0

在文字识别OCR中，在微信小程序里面调用ocr识别失败这是什么原因？

576

3

0

有文字识别OCR识别财报的服务吗？

123

1

0

文字识别OCR这个报错怎么解决？我上传的文件小于1M呀。

71

0

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

技术赋能医药全链路：AI 大模型应用在药企的落地痛点与破局之道

Qwen3-Omni新升级:声形意合，令出智随！

蝉联六冠，阿里云金融云市场第一

还在研究部署PaddleOCR？数眼智能OCR文档解析API上线：免费使用！

别再手动对账了！rpa财务机器人软件如何实现“易用、实用、好用”？

热门讨论

热门文章

文字识别OCR目前有哪些情况会导致识别失败？

OCR营业执照识别失败什么原因？

文字识别OCR支持图片分类吗？

文字识别OCR识别失败是因为什么？报错 code 464

OCR发票识别不到？

文字识别OCR怎么做作业&试卷的自动批改？

ocr通用文字识别后付费和资源包价格是不一样吗？

身份证识别ocr，每次购买需要更换url地址吗？

有自定义表格手写体文字识别OCR的产品吗？

文字识别OCR 行驶证识别最近总是识别错误，能看一下么？

展开全部

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

视觉智能开放平台【文字识别】类目新增五个AI算法，快来看看吧~

OCR文字识别技术总结（一）

分析对比大模型OCR、传统OCR和深度学习OCR

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

CRNN文字识别

OCR文字识别方法综述

分享：如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用，图片批量识别转excel表格的方法

从图片提取文字的终极解决方法 ——【通用文字识别 API】

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

展开全部

还有其他疑问?