开发者社区 > 视觉智能 > 文字识别 > 正文

在文字识别OCR我需要用什么OCR场景接口好?

公司有一个场景,需要根据收件人地址识别出文字,客户截图的地方可能不规律,需要根据用户上传的图片,从中获取收件人的信息,大部分场景是针对于国外地址的。在文字识别OCR我需要用什么OCR场景接口好?

展开
收起
小小鹿鹿鹿 2023-09-18 12:52:50 77 0
4 条回答
写回答
取消 提交回答
  • 十分耕耘,一定会有一分收获!

    楼主你好,根据您的需求,可以考虑使用阿里云的通用文字识别(OCR)API。通用文字识别API适用于多种场景,可以识别各种语言的文字,支持多种图片格式,包括邮件、身份证、发票、营业执照等多种场景。

    具体操作步骤如下:

    1. 登录阿里云控制台,在左侧菜单栏中找到“文字识别OCR”服务,点击进入。

    2. 在该服务的页面中,找到“通用文字识别API”接口并点击进入。

    3. 在接口中,上传需要识别的图片,等待系统自动识别并返回结果。

    4. 对于返回的结果,使用您的程序进行解析和处理。

    需要注意的是,由于场景不规律且需要识别国外地址,可能存在一定的识别误差,建议在使用该接口时,进行适当的校验和调试,以确保识别结果的准确性。

    2023-09-24 11:17:56
    赞同 展开评论 打赏
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,根据您描述的情况来看,您可以使用文字识别OCR的电商订单页识别,支持包括订单编号、收货信息、交易金额、店铺名称、商品详单等关键字段结构化识别输出
    image.png
    如果识别效果不能满足您要求的话,建议您可以采用文字识别OCR文档自学习的方式,通过进行模型训练、标注,发布后进行模型推理来提高特定场景的文字识别准确率
    image.png

    2023-09-21 21:58:30
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    对于您描述的场景,您可以考虑使用通用文字识别(General Text Recognition)OCR场景接口。该接口适用于从图片中提取各种常见文本内容,包括地址、姓名、电话号码等。

    通用文字识别OCR场景接口通常具有以下特点:
    image.png

    1. 多语言支持:能够处理多种语言文字,包括国外地址所使用的语言。

    2. 布局自动检测:能够根据不同的图片布局和文本排列方式进行自动检测和识别。

    3. 文字位置信息输出:能够提供识别结果中文字的具体位置信息,方便后续的处理和分析。

    4. 支持图像预处理:一些OCR服务还提供图像预处理功能,如旋转矫正、模糊去噪等,以提升文字识别的准确性。
      image.png

    在选择OCR服务时,可以注意以下几点:

    • 准确率和性能:确保所选OCR服务具有较高的准确率和稳定的性能,以满足您的需求。

    • 多语言支持:确保所选OCR服务支持您需要处理的国外语言和地址格式。

    • 接口集成:查看所选OCR服务的API文档和示例代码,确保其与您使用的编程语言和开发环境相兼容。

    • 用户反馈和评价:查看其他用户对所选OCR服务的评价和反馈,以了解其实际效果和可靠性。

    2023-09-19 16:40:00
    赞同 展开评论 打赏
  • 这种建议试一下自学习平台 可以咨询这个群 “【官方】阿里云文档智能客户交流群”群的钉钉群号: 44854217。此回答整理自钉群【官方】阿里云OCR公共云客户交流群。

    2023-09-18 14:39:06
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载