20行代码教你如何批量提取图片中文字

本文涉及的产品
企业资质识别,企业资质识别 200次/月
文档理解,结构化解析 100页
票据凭证识别,票据凭证识别 200次/月
简介: 大家好,我是志斌~之前志斌在考研的时候遇到了一个问题,就是要将图片中的文字给提取出来,当时是J哥帮忙搞出来的,现在已经考完研了,也学会了提取方式,现在来给大家分享一下。

01创建账号


我们这次使用的是百度AI上的文字识别功能,来将图片上的文字进行提取。

我们先打开百度AI界面,然后点击控制台。


71.png

跳转到登陆界面后,输入账号密码后,跳转到管理界面,此时我们点击文字识别。进入到文字识别应用界面。


72.png



然后创建一个应用(如已创建好,就点击管理应用)。


73.png


创建好后,进入到应用列表中,记下来‘AppID’、‘API Key’、‘Secret Key’这三个参数的值。在后面对API进行调用的时候需要用到这三个参数。


74.png


02提取文字


我们在上面已经注册号百度AI的账号了,现在我们要开始使用它来将图片中的文字给提取出来。

首先,我们先安装一下要使用到的库。


pip install baidu-aip


这个库里提供了两个函数:AipOcr函数和client.basicGeneral函数。这两个函数一个实现用户验证功能,另一个实现了文字识别功能。代码如下:


from aip import AipOcr
APP_ID = '你的APPID'
API_KEY = 'API Key'
SECRET_KEY = '你的Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
with open(img,'rb') as f:
   image = f.read()
word = client.basicGeneral(image)


转换效果如下:


75.png


从图中可以看出,这样的转化方式还是比率还是很高的。

03批量提取


我们已经学会如何提取单张图片中的文字了,现在我们只要能够遍历图片就可以了。在上一篇 文章中,我们分享了一个遍历该目录下Excel文件的办法,遍历图片其实和他一样,只不过把Excel换成jpg即可。代码如下:


from pathlib import Path, PurePath
files = []
p = Path(src_path)
for x in p.iterdir():
   if PurePath(x).match('*.jpg'):
      files.append(x)


04小结


批量提取图片文字的思路是:

1. 注册百度AI的账号。

2. 通过调用百度AI,将图片中的文字提取。

3. 将提取出来的文字进行保存。

4. 依次遍历该目录下所有图片,重复2、3操作。


后台回复转化,即可获得源码。

相关文章
|
26天前
|
编解码 文字识别 自然语言处理
如何使用OCR技术批量识别图片中的文字并重命名文件,OCR 技术批量识别图片中的文字可能出现的错误
### 简介 【批量识别图片内容重命名】工具可批量识别图片中的文字并重命名文件,方便高效处理大量图片。然而,OCR 技术面临字符识别错误(如形近字混淆、生僻字识别不佳)、格式错误(段落错乱、换行问题)和语义理解错误等挑战。为提高准确性,建议提升图片质量、选择合适的 OCR 软件及参数,并结合自动校对与人工审核,确保最终文本的正确性和完整性。
98 12
如何使用OCR技术批量识别图片中的文字并重命名文件,OCR 技术批量识别图片中的文字可能出现的错误
|
4月前
|
定位技术
|
8月前
|
存储 Python
python实现图片与视频转换:将视频保存为图片,将批量图片保存为视频
python实现图片与视频转换:将视频保存为图片,将批量图片保存为视频
|
6月前
[PDF提取重命名]提取识别文字并对PDF文件批量重命名,提取PDF指定可复制的内容并批量重命名PDF,批量PDF文档指定识别提取区域
本文介绍一款实用工具,能快速从可复制内容的PDF中提取指定区域信息并据此重命名文件。设置提取坐标及导入PDF文档、设定新文件名后启动提取流程,即可高效批量处理。保存坐标设置以便重复使用,适用于需频繁修改大量PDF文件名的场景。
625 0
[PDF提取重命名]提取识别文字并对PDF文件批量重命名,提取PDF指定可复制的内容并批量重命名PDF,批量PDF文档指定识别提取区域
|
9月前
|
文字识别 测试技术 数据安全/隐私保护
案例:批量区域识别内容重命名,批量识别扫描PDF区域内容识别重命名,批量识别图片区域内容重命名图片修改图片名字,批量识别图片区域文字并重命名,批量图片部分识别内容重命文件,PDF区域内容提取重命名
该内容介绍了如何使用区域识别重命名软件高效整理图片,例如将图片按时间及内容重命名,适用于简历、单据等识别。文中提供了软件下载链接(百度云盘和腾讯网盘),并列出软件使用的几个关键条件,包括文字清晰、文件名长度限制等。示例展示了银行单据和公司工作单据的识别情况。文章还提及OCR技术在图片文字识别中的应用,强调了识别率、误识率和用户友好性等评估指标。如有类似需求,读者可留言或下载软件测试,并提供图片以获取定制的识别方案。
415 2
|
9月前
|
机器学习/深度学习 文字识别 数据安全/隐私保护
Python实现从PDF和图片提取文字的方法总结
Python实现从PDF和图片提取文字的方法总结
524 0
|
前端开发 API 开发工具
批量提取某音文案
本文介绍了批量提取文案的思路, 以及操作过程中的问题的处理方法, 并给了详细的参考代码, 以及对应的文档.
295 0
在本地上创建一个文件并且写入一些文字数据
在本地上创建一个文件并且写入一些文字数据
|
开发者
图片与文字的修改| 学习笔记
快速学习图片与文字的修改。
图片与文字的修改| 学习笔记
【图片操作】混合图片
混合图片的方式有很多种,我们先来看看如何通过混合图片的通道来实现图片混合。
163 0