应用开发图像识别之经典方法

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 花无从开日,人无再少年,加油!。 今天主要和大家聊一聊,如何使用百度AI实现图像识别的方法,在现实生活中,我们会看到停车场,高速路口有车牌识别。现在很多车牌方案商都有成熟的车牌识别技术,它们是靠这个吃饭的,不会开源。本次文章主要是使用这些方案商的接口来做识别,百度AI的识别效率是非常高的,毕竟让别人花钱的东西是不一样的。

第一:百度车牌接口申请简介


   首先,在浏览器输入“百度车牌识别”搜索。

3391fa1884019216bdbdcc8f4f0480e3.png     点击“技术文档”,其中需要参考技术文档来查看使用手册,它里面会介绍API相关使用方法和测试方法。

d886d6f6cb3cf2e4f7b145269586fc78.png

 我们只需要领取车牌识别功能资源,根据百度提供的“技术文档”可以知道,在文字识别》购买指南》免费测试资源,可以看到未实名认证的用户免费领取车牌识别功能为 200 次/月,实名认证是 1000 次/月。根据自己所需,勺情实名认证。在快速入门》新手操作指引处,我们在领取资源页面找到车牌识别,勾选“车牌识别”,然后点 0 元领取即可。


df1a31e919b575765bfb3d4b0e484285.png

点击上图的文字识别控制台(蓝色字体)就可以看跳转到创建文字识别的应用了。如下图。

点击创建应用后。在文字识别应用列表中,默认会把文字识别的应用全部勾选了,如下图。接

着填上相关信息,完成创建即可。

c41288ee41e9a2b1e02905595a00e405.png

创建完成后,查看应用的 API Key 和 Secret Key。因为下面的程序需要用到。

8d315531c51c24a5e2d1d16c40f46c5d.png

第二:百度识别代码实现


   在源码路径下,先编写ocr.h源文件

#ifndef OCR_H
#define OCR_H
#include <QNetworkAccessManager> 
#include <QNetworkReply> 
#include <QJsonDocument> 
#include <QJsonParseError> 
#include <QJsonObject>
#include <QJsonArray>
#include <QHostInfo>
#include <QFile>
#include <QImage>
class Ocr : public QObject
{
 Q_OBJECT
 public:
 Ocr(QObject *parent = nullptr);
 ~Ocr();
 /* 请求网络 */
 void requestNetwork(QString, QByteArray);
/* 获取识别结果 */
 void getTheResult(QString fileName);
 void getTheResult(QImage image);
 private:
 /* 存储获取 tokenUrl 地址 */
 QString tokenUrl;
 /* 存储 serverapi 地址 */
 QString serverApiUrl;
 /* 最终需要访问 token 的地址 */
 QString accessToken;
 /* 获取 token 的接口*/
 const QString token_org ="https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials
&client_id=%1&client_secret=%2&";
 /* 填写网页上申请的 appkey 如 api_key ="g8eBUMSokVB1BHGmgxxxxxx" */
 const QString api_key = "填写自己的 APP KEY";
 /* 填写网页上申请的 APP SECRET 如
secret_key="94dc99566550d87f8fa8ece112xxxxx" */
 const QString secret_key = "填写自己的 APP SECRET";
 /* 百度服务器 API 接口,发送图片可返回识别结果 */
 const QString server_api ="https://aip.baidubce.com/rest/2.0/ocr/v1/license_plate?access_token=%1
";
 /* 网络管理 */
 QNetworkAccessManager *networkAccessManager;
/* 处理 Json 数据 */
 QString getJsonValue(QByteArray ba, QString key);
 /* 处理 Json 数据 */
 QString getJsonValue(QByteArray ba, QString key1, QString key2);
 public slots:
 /* 准备读取响应返回来的数据 */
 void readyReadData();
 /* 响应完成处理 */
 void replyFinished();
 /* 开始识别 */
 void readyToDetection(QString);
 void readyToDetection(QImage);
 signals:
 /* 识别到车牌,发送信号 */
 void ocrReadyData(QString);
 };
 #endif // OCR_H

请填写读者自己在网页上申请的 API Key。本例不提供开放的 API Key,请填写自已个人申请的!


请填写读者在网页上申请的 Secret Key。本例不提供开放的 Secret Key,请填写自已个人申请的!


ocr 文件夹为车牌识别的应用程序,主要发送本地图片到百度车牌识别服务器上,然后返回识别结果。


Headers 文件夹为界面的头文件。


Sources 文件夹为界面的源文件。


注意:运行之前需要把项目下的 image 文件夹拷贝到可执行程序的同级目录下。此 image 文件夹目录存放的是要识别的车牌图片,若想替换自己的图片,需要把要识别的图片替换到 image 文件夹下的 carlpr.jpg,名字要相同。运行结果如下。


注意:Ubuntu 或者开发板需要联网!本程序适用于 Ubuntu18 和 I.MX6U开发板,Ubuntu16 会报 Openssl 版本错误!请注意!这就是为什么建议需要读者使用和笔者相同版本 Ubuntu 来开发的原因了!毕竟初学者处理不同的开发环境还是有点难度的!


第三:实现效果


ec6838a9ebfde42997197de468e550fd.png

效果分析如下:


运行程序后,界面会显示要识别的车牌图片,如果没有显示,是因为您没有把 image 文件夹拷贝到可执行程序的同级路径下。程序运行会根据您在百度上申请的车牌识别服务上的 API Key 与 Secert Key 来获取 token,获取 token 后,我们点击左上角的按钮就可以发送界面上显示的图片到百度车牌识别服务器上,服务器即会返回车牌识别结果。过程非常简单。如上图,识别的结果在界面的左上角


总结:我们使用了百度车牌识别的接口来完成这个车牌识别的过程,在这里我们虽然我们不能学到车牌识别的算法,但是我们也学会了怎么根据百度 ai 的帮助文档去调用。并不是所有的车牌识别算法都开源,毕竟也是别人的成果,别人的成果也是要付出的。此例程仅供参考使用。实际用到项目上请购买相关的车牌识别产品。


目录
相关文章
|
3月前
|
机器学习/深度学习 自然语言处理 负载均衡
揭秘混合专家(MoE)模型的神秘面纱:算法、系统和应用三大视角全面解析,带你领略深度学习领域的前沿技术!
【8月更文挑战第19天】在深度学习领域,混合专家(Mixture of Experts, MoE)模型通过整合多个小型专家网络的输出以实现高性能。从算法视角,MoE利用门控网络分配输入至专家网络,并通过组合机制集成输出。系统视角下,MoE需考虑并行化、通信开销及负载均衡等优化策略。在应用层面,MoE已成功应用于Google的BERT模型、Facebook的推荐系统及Microsoft的语音识别系统等多个场景。这是一种强有力的工具,能够解决复杂问题并提升效率。
117 2
|
3月前
|
机器学习/深度学习 自然语言处理 自动驾驶
【深度学习】深度学习的详细解析:涵盖定义、技术原理及应用场景
深度学习(Deep Learning)是机器学习(Machine Learning)的一个重要分支,它通过使用多层的神经网络来模拟人脑的学习过程,从而实现对数据的分析和理解。以下是关于深度学习的详细解析
185 2
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】AudioLM音频生成模型概述及应用场景,项目实践及案例分析
AudioLM(Audio Language Model)是一种基于深度学习的音频生成模型,它使用自回归或变分自回归的方法来生成连续的音频信号。这类模型通常建立在Transformer架构或者类似的序列到序列(Seq2Seq)框架上,通过学习大量音频数据中的统计规律,能够生成具有高保真度和创造性的音频片段。AudioLM模型不仅能够合成音乐、语音,还能生成自然界的声音、环境噪声等,其应用广泛,涵盖了娱乐、教育、辅助技术、内容创作等多个领域。
89 1
|
6月前
|
机器学习/深度学习 算法 大数据
基于深度学习的图像识别技术:原理与实践
基于深度学习的图像识别技术:原理与实践
334 4
|
6月前
|
机器学习/深度学习 数据采集 监控
构建一个基于机器学习的图像识别系统
【5月更文挑战第29天】构建基于机器学习的图像识别系统涉及数据准备、模型选择、训练优化及部署测试。数据准备包括收集多样化数据集、预处理和数据划分;模型选择常选用CNN、RNN/LSTM或GAN;训练优化涉及模型训练、评估与选择;最后,部署到实际应用时要考虑计算效率和内存占用,并持续更新维护模型。
|
6月前
|
机器学习/深度学习 人工智能 算法
构建一个基于AI的语音识别系统:技术深度解析与实战指南
【5月更文挑战第28天】本文深入探讨了构建基于AI的语音识别系统,涵盖基本原理、关键技术及实战指南。关键步骤包括语音信号预处理、特征提取、声学模型、语言模型和解码器。深度学习在声学和语言模型中发挥关键作用,如RNN、LSTM和Transformer。实战部分涉及数据收集、预处理、模型训练、解码器实现及系统评估。通过本文,读者可了解构建语音识别系统的基本流程和技巧。
|
6月前
|
机器学习/深度学习 算法 算法框架/工具
如何快速高效全面的学习计算机视觉技术
如何快速高效全面的学习计算机视觉技术
|
6月前
|
机器学习/深度学习 自然语言处理 语音技术
语音识别技术的原理与应用
语音识别技术的原理与应用
|
6月前
|
机器学习/深度学习 传感器 自动驾驶
【计算机视觉】一、多任务深度学习网络的概念及在自动驾驶中的应用讲解(图文解释 超详细)
【计算机视觉】一、多任务深度学习网络的概念及在自动驾驶中的应用讲解(图文解释 超详细)
96 0
|
机器学习/深度学习 人工智能 自然语言处理
NLP机器翻译全景:从基本原理到技术实战全解析
NLP机器翻译全景:从基本原理到技术实战全解析
127 0
下一篇
无影云桌面