又要起飞,浏览器居然都可以本地 OCR 啦

简介: 又要起飞,浏览器居然都可以本地 OCR 啦

前言


PaddleOCR,这是一个由百度开发的开源 OCR(Optical Character Recognition,光学字符识别)工具,它可以用于从图像中识别文本。

PaddleOCR支持多种语言的文本识别,并且能够处理多种场景下的图像。

现在 PaddleOCR 也支持在浏览器中直接运行啦。

FastDeploy 介绍

FastDeploy 是一款全场景、易用灵活、极致高效的AI推理部署工具, 支持云边端部署。

提供超过 🔥160+ Text,Vision, Speech和跨模态模型开箱即用的部署体验,并实现🔚端到端的推理性能优化。

包括 物体检测、字符识别(OCR)、人脸、人像扣图、多目标跟踪系统、NLP、Stable Diffusion文图生成、TTS 等几十种任务场景,满足开发者多场景、多硬件、多平台的产业部署需求。

安装

克隆仓库


git clone https://github.com/PaddlePaddle/FastDeploy/

打开 web_demo 目录


cd examples/application/js/web_demo/

安装依赖并运行


yarn && yarn dev


打开该地址即可看到demo

运行效果

主界面

文本识别


代码

项目中关于 OCR 使用的代码非常简单,,如下:


import * as ocr from "@paddle-js-models/ocr";
onMounted(async () => {
  canvas.value = document.getElementById("canvas") as HTMLCanvasElement;
  await ocr.init();
  isLoadingModel.value = false;
});
const predict = async () => {
  const img = document.getElementById("raw-img") as HTMLImageElement;
  const res = await ocr.recognize(img, { canvas: canvas.value });
  console.log(res);
  if (res.text?.length) {
    // 页面展示识别内容
    result.value = res.text.reduce((total, cur) => total + `<p>${cur}</p>`);
  }
};

可见已经封装得十分地完整和简便了。

总结

本文对 web 中直接使用 OCR 的方法进行了简述,但并未对实际使用和具体实现原理等进行分析。

单从效果上看,已经接本上达到了可用级别。

后面我们再接着深入讨论原理和应用。



相关文章
|
安全 大数据 BI
阿里云数据中台发布智能风控引擎Quick Decision和隐私计算DataTrust,升级品牌主张
阿里云数据中台产品矩阵再丰富, Quick Decision和DataTrust双产品公开亮相,同时发布全新品牌视频,升级品牌主张!
15585 0
阿里云数据中台发布智能风控引擎Quick Decision和隐私计算DataTrust,升级品牌主张
|
1月前
|
人工智能 自然语言处理 安全
MCP 打造 AI Agent 的 5 大最佳实践
面对流量激增、系统告急,单一渠道AI Agent难堪重负?问题不在能力,在架构!MCP(多渠道平台)作为智能体“神经中枢”,可统一调度Web、微信、钉钉等多渠道任务,实现高并发、可扩展的自动化。本文详解企业级MCP构建AI Agent的五大最佳实践:模块拆分、工具选型、设计模式、上下文管理与安全可控,助你快速落地高效、稳定的智能系统。
|
5月前
|
数据安全/隐私保护
全自动刷视频脚本, 抖音自动脚本快手小红书,抖音快手自动刷金币脚本【autojs】
这个脚本展示了如何使用AutoJS进行基本的自动化操作,包括应用启动、屏幕滑动和随机点击等
|
10月前
|
算法 搜索推荐 Windows
审稿人直呼简洁,单点PageRank终极版!人大STOC论文让复杂度优化至理论最优
人民大学研究团队在STOC发表论文《Revisiting Local Computation of PageRank: Simple and Optimal》,提出一种局部计算PageRank的新算法,显著降低计算复杂度。该算法仅关注目标节点及其周围节点,避免遍历全网,提升大规模网络处理效率。研究改进了ApproxContributions算法的时间复杂度,并通过简洁的分析方法证明其最优性,解决了长期存在的开放问题。论文还优化了PageRank中心性的计算复杂度,为信息检索和网络分析提供新思路。然而,结果可能受限于特定网络模型,实际应用效果需进一步验证。
182 7
|
数据采集 机器学习/深度学习 数据可视化
从零到一建设数据中台 - 数据服务开发
从零到一建设数据中台 - 数据服务开发
372 0
|
SQL Java 数据库连接
快速搭建SSM项目【最全教程】~令狐小哥版
快速搭建SSM项目【最全教程】~令狐小哥版
849 1
|
JSON SpringCloudAlibaba Java
Springcloud Alibaba + jdk17+nacos 项目实践
本文基于 `Springcloud Alibaba + JDK17 + Nacos2.x` 介绍了一个微服务项目的搭建过程,包括项目依赖、配置文件、开发实践中的新特性(如文本块、NPE增强、模式匹配)以及常见的问题和解决方案。通过本文,读者可以了解如何高效地搭建和开发微服务项目,并解决一些常见的开发难题。项目代码已上传至 Gitee,欢迎交流学习。
1078 1
Springcloud Alibaba + jdk17+nacos 项目实践
|
机器学习/深度学习 移动开发 前端开发
解密 SSE,像 ChatGPT 一样返回流式响应
解密 SSE,像 ChatGPT 一样返回流式响应
842 1
|
编解码 文字识别 C语言
PyMuPDF 1.24.4 中文文档(十)(3)
PyMuPDF 1.24.4 中文文档(十)
300 0