PAI AI行业插件OCR识别Quick Start

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 机器学习平台PAI(Platform of Artificial Intelligence)上AI行业插件提供视觉模型训练插件和通用模型训练插件,支持在线标注、自动模型训练、超参优化及模型评估。只需要准备少量标注数据,并设置训练时长,就可以得到深度优化的模型。同时,插件平台与PAI-EAS高效对接,可以一键完成模型部署。本文介绍使用视觉模型训练插件进行OCR(Optical Character Recognition)识别的详细流程,以供参考。

Step By Step

  • 1.创建oss bucket,上传测试数据文件:下载OCR Demo数据。
  • 2.创建实例,新建数据集:用于数据标注
  • 3.创建任务
  • 4.查看训练详情
  • 5.服务端部署模型
  • 6.控制台在线调试

一.创建oss bucket,上传测试数据

  • 为了便于测试,可以新建一个Bucket,之后将文本demo上传至新建Bucket中
  • :(1)数据集可以采用纯图片式的,需要手动标注。也可以采用符合数据集规范的带有标注结果的XML文件。本文采用纯图片式的数据集用于测试
      (2)OCR识别的图像需要满足数据集要求和规范,详见使用限制

lQLPJxadVGoeMJbNArPNBZGwTniPhu7h824DAtXaTYAnAA_1425_691.png


二.创建实例,新建数据集:用于数据标注

  • 1.创建实例

lQLPJxadU7504OPNAr3NB2ywcBCdvW59r6QDAtTA_0BCAA_1900_701.png


  • 2.新建数据集

lQLPJxadTv-2wEfNAsXNBqOwP2GN_BZzruEDAsz6jkAGAA_1699_709.png


  • 3.数据标注

lQLPJxad3x5kmWDNAzbNBiKwlx2D1cy3UhQDA7ka4YBvAA_1570_822.png


lQLPJxad4zgH3OjNA0PNBgiwwcybaVCLxNYDA7_SMEBaAA_1544_835.png

三.创建任务

lQLPJxadT_jcfh3NAubNB02wOcK5qGY-bt8DAs6S8UCEAA_1869_742.png


lQLPJxadUA7qPoHNAsTNBhuwt6Kn_n-pu6cDAs63EkB1AA_1563_708.png

四.查看训练详情

lQLPJxad54kZ0xfNAtvNBnSwC3nVWcUmrV8DA8blkwBvAA_1652_731.png


lQLPJxad58Lq2YfNA0fNBb6wy4BUMa1DQwcDA8dEQ8B1AA_1470_839.png

五.服务端部署模型

1661218999713_80AA33D2-51D2-4a8a-AC67-A37DAA9D8B37.png


1661219127405_205AED37-8FE1-4e32-8D4D-F3F6EA3F8864.png


六.控制台在线调试

  • 1.请求Body示例
{
  "dataArray":[
    {
      "name":"image",
      "type":"stream",
      "body":"base64数据"
    }
  ]
}

image.png

  • 3.在线调试

lQLPJxad3bZhf83NAr7NBf6w0HO95k9nE7UDA7bMswBuAA_1534_702.png


1661218935352_D60AC39D-7CC3-4be8-BFCA-7FEEDB2CBC4A.png

更多参考

PAI-AutoLearning 图像分类使用教程

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
3月前
|
机器学习/深度学习 人工智能 安全
探索AI的未来:从机器学习到深度学习
【10月更文挑战第28天】本文将带你走进AI的世界,从机器学习的基本概念到深度学习的复杂应用,我们将一起探索AI的未来。你将了解到AI如何改变我们的生活,以及它在未来可能带来的影响。无论你是AI专家还是初学者,这篇文章都将为你提供新的视角和思考。让我们一起探索AI的奥秘,看看它将如何塑造我们的未来。
102 3
|
28天前
|
存储 人工智能 大数据
AI开发新范式,PAI模型构建平台升级发布
本次分享由阿里云智能集团产品专家高慧玲主讲,聚焦AI开发新范式及PAI模型构建平台的升级。分享分为四个部分,围绕“人人可用”和“面向生产”两大核心理念展开。通过降低AI工程化门槛、提供一站式全链路服务,PAI平台致力于帮助企业和开发者更高效地实现AI应用。案例展示中,介绍了多模态模型微调在文旅场景的应用,展示了如何快速复现并利用AI解决实际问题。最终目标是让AI技术更普及,赋能各行业,推动社会进步。
|
10天前
|
机器学习/深度学习 人工智能 文字识别
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
59 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
|
4月前
|
机器学习/深度学习 数据采集 人工智能
AI与机器学习:从理论到实践
【10月更文挑战第2天】本文将深入探讨AI和机器学习的基本概念,以及它们如何从理论转化为实际的应用。我们将通过Python代码示例,展示如何使用机器学习库scikit-learn进行数据预处理、模型训练和预测。无论你是AI领域的初学者,还是有一定基础的开发者,这篇文章都将为你提供有价值的信息和知识。
|
29天前
|
SQL 人工智能 关系型数据库
PolarDB-PG AI最佳实践 2 :PolarDB AI X EAS实现自定义库内模型推理最佳实践
PolarDB通过POLAR_AI插件支持使用SQL调用AI/ML模型,无需专业AI知识或额外部署环境。结合阿里云EAS在线模型服务,可轻松部署自定义模型,在SQL中实现如文本翻译等功能。
|
28天前
|
人工智能 安全 大数据
PAI年度发布:GenAI时代AI基础设施的演进
本文介绍了AI平台在大语言模型时代的新能力和发展趋势。面对推理请求异构化、持续训练需求及安全可信挑战,平台推出了一系列优化措施,包括LLM智能路由、多模态内容生成服务、serverless部署模式等,以提高资源利用效率和降低使用门槛。同时,发布了训推一体调度引擎、竞价任务等功能,助力企业更灵活地进行训练与推理任务管理。此外,PAI开发平台提供了丰富的工具链和最佳实践,支持从数据处理到模型部署的全流程开发,确保企业和开发者能高效、安全地构建AI应用,享受AI带来的红利。
|
2月前
|
人工智能 安全 算法
PAI负责任的AI解决方案: 安全、可信、隐私增强的企业级AI
在《PAI可信AI解决方案》会议中,分享了安全、可信、隐私增强的企业级AI。会议围绕三方面展开:首先通过三个案例介绍生活和技术层面的挑战;其次阐述构建AI的关键要素;最后介绍阿里云PAI的安全功能及未来展望,确保数据、算法和模型的安全与合规,提供全方位的可信AI解决方案。
|
28天前
|
人工智能 容灾 Serverless
AI推理新纪元,PAI全球化模型推理服务的创新与实践
本次分享主题为“AI推理新纪元,PAI全球化模型推理服务的创新与实践”,由阿里云高级产品经理李林杨主讲。内容涵盖生成式AI时代推理服务的变化与挑战、play IM核心引擎的优势及ES专属网关的应用。通过LM智能路由、多模态异步生成等技术,PAI平台实现了30%以上的成本降低和显著性能提升,确保全球客户的业务稳定运行并支持异地容灾,目前已覆盖16个地域,拥有10万张显卡的推理集群。
|
28天前
|
人工智能 运维 API
PAI企业级能力升级:应用系统构建、高效资源管理、AI治理
PAI平台针对企业用户在AI应用中的复杂需求,提供了全面的企业级能力。涵盖权限管理、资源分配、任务调度与资产管理等模块,确保高效利用AI资源。通过API和SDK支持定制化开发,满足不同企业的特殊需求。典型案例中,某顶尖高校基于PAI构建了融合AI与HPC的科研计算平台,实现了作业、运营及运维三大中心的高效管理,成功服务于校内外多个场景。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
机器学习之解释性AI与可解释性机器学习
随着人工智能技术的广泛应用,机器学习模型越来越多地被用于决策过程。然而,这些模型,尤其是深度学习模型,通常被视为“黑箱”,难以理解其背后的决策逻辑。解释性AI(Explainable AI, XAI)和可解释性机器学习(Interpretable Machine Learning, IML)旨在解决这个问题,使模型的决策过程透明、可信。
109 2