阿里云视觉训练-第二天

本文涉及的产品
文档理解,免费额度 各100页
OCR统一识别,每月200次
小语种识别,小语种识别 200次/月
简介: 今天使用阿里云视觉平台API快速开发在线视觉AI平台,了解如何搭建身份证识别系统,从而扩展到其他的识别系统。

一、身份证识别

效果说明:用户上传图片,页面显示提取的相关信息。

二、系统的核心逻辑

1.利用SDK完成识别功能

OCR的SDK获取与使用
实现步骤:先打开视觉智能开放平台——文字识别——身份证识别——查看产品文档——SDK参考——在JAVA中提供两种SDK,分别是通用(需要提供OSS中的URL)和新版(支持本地文件上传)。
SDK获取与使用:先找到OCR的SDK,复制连接+OCR,现阶段使用1.0.3版本。

2.项目实现逻辑

前端讲解:页面包含要素介绍。
讲解控制器层:JAVA代码讲解。定义私有变量讲解,两个控制方法讲解。
讲解配置文件:修改目录。
讲解上传文件的地址
讲解调用实现逻辑

3.总结

根据老师的操作,初步的了解实现人工智能的逻辑!收获颇丰!明天加油!

目录
相关文章
|
4月前
|
算法 前端开发
赢得比赛需要的最少训练时长
赢得比赛需要的最少训练时长
43 0
|
23天前
|
数据采集 人工智能 自然语言处理
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效
【8月更文挑战第29天】豆包大模型与香港大学团队合作研发的ByteCheckpoint系统,旨在应对大语言模型(LLM)开发中的数据规模庞大、计算资源昂贵及训练过程不稳定的挑战。该系统通过统一检查点机制、细粒度资源管理和多模态数据处理等创新技术,显著提升了LLM的训练效率和模型性能,并已在多个实际场景中取得显著效果。
30 4
|
16天前
|
自然语言处理 计算机视觉
给视频模型安上快慢两只眼睛,苹果免训练新方法秒了一切SOTA
【9月更文挑战第5天】近年来,视频大型语言模型(LLM)在计算机视觉领域取得显著进展,但高昂的监督微调成本成为瓶颈。苹果研究人员提出了免训练的SF-LLaVA模型,采用慢流(捕捉空间语义)和快流(捕捉时序上下文)的双流设计,能高效处理视频中的静态与动态信息,显著提升了开放性视频问答、多选视频问答及文本生成等任务的表现。然而,该模型在复杂视频场景理解和特定任务泛化能力方面仍有局限。论文详见:https://arxiv.org/pdf/2407.15841
23 1
|
2月前
|
机器学习/深度学习 并行计算 PyTorch
PyTorch | 加速模型训练的妙招
PyTorch | 加速模型训练的妙招
20 0
|
3月前
使用高性能服务器训练StableDiffusion——人物模型.safetensors
使用高性能服务器训练StableDiffusion——人物模型.safetensors
33 0
|
机器学习/深度学习 机器人 计算机视觉
耗时两年,谷歌用强化学习打造23个机器人帮助垃圾分类
耗时两年,谷歌用强化学习打造23个机器人帮助垃圾分类
|
语音技术
三分钟视频|看懂多情感语音合成模型训练过程
三分钟视频|看懂多情感语音合成模型训练过程
129 0
|
达摩院
三分钟视频|看懂达摩院语音降噪模型训练全过程
三分钟视频|看懂达摩院语音降噪模型训练全过程
179 0
|
存储 人工智能 自然语言处理
预训练知识度量比赛夺冠!阿里云PAI发布知识预训练工具
阿里云计算平台PAI团队携手达摩院智能对话与服务技术团队,在CCIR Cup2021全国信息检索挑战杯的《预训练模型知识量度量》比赛中基于自研的融入知识预训练模型取得第一名。团队采用自研的知识预训练模型KGBERT和DKPLM为底座,采用多样化知识融入方法,形成强有力的蕴含丰富知识的预训练模型,在比赛数据上取得了非常好的效果。
817 0
预训练知识度量比赛夺冠!阿里云PAI发布知识预训练工具
|
传感器 机器人 语音技术
牙医训练机器人到底能有多恐怖?!
牙医训练机器人到底能有多恐怖?!
173 0