开发者社区开发与运维文章正文

Tesseract-OCR安装及使用

2022-11-26 3126

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

文档理解，结构化解析 100页

通用文字识别，通用文字识别 200次/月

自定义KV模板，自定义KV模板 500次/账号

简介： Tesseract-OCR安装及使用

1、tesseract下载地址：https://digi.bib.uni-mannheim.de/tesseract/

其中带有dev的为开发版本，作者下载的版本为：tesseract-ocr-setup-3.05.01.exe

2、双击ex进行安装，同意协议并继续。

为.png

勾选Additional language data(download)选项支持识别的语言包。

我.png

选择安装目录

前.png

安装完成

其.png

3、配置环境变量，在path里面添加Tesseract-OCR的安装目录。

请.png

在CMD里面验证，是否安装成功，输入tesseract -v，出现以下信息则表示安装成功。

4、在python里面使用tesseract。安装pytesseract。

pip install pytesseract

5、使用

from PIL import Image
import pytesseract
text = pytesseract.image_to_string(Image.open(r'test.png'))
print(text)

运行报错：pytesseract.pytesseract.TesseractError: (1,’Error opening data file /usr/local/share/tessdata/eng.traineddata’)。解决办法为添加系统变量TESSDATA_PREFIX，值为D:\Program Files (x86)\Tesseract-OCR\tessdata。然后重启以下电脑即可。

去.png

文章标签：

文字识别

Python

关键词：

印刷文字识别安装

游客lopnqntuhj7l2

爱你三千遍斯塔克

4月前

机器学习/深度学习人工智能文字识别

文本，文字识别02----PaddleOCR基础概念及介绍，安装和使用，人工智能是一种使计算机模仿人类的一种技术，PaddleOCR的安装地址-https://www.paddlepaddle.org

爱你三千遍斯塔克

123 6 6

小凡晓宇

文字识别

autojs之浩然ocr-不安装插件就能用ocr

使用场景不想安装浩然ocr插件

小凡晓宇

1622 0 0

微wx笑

光学字符识别引擎 Tesseract-ocr 安装过程

上篇我们对 Tesseract-ocr 做了一个简要的介绍，下面我们来看一下的安装过程。注意：这里只是当你不想去下载源代码进行编译或优化、修改、定制的情况，使用现有的安装包去安装使用。安装包下载地址：稳定版：https://digi.

微wx笑

1328 0 0

三分钟热度的鱼

4月前

文字识别

印刷文字识别使用问题之是否支持非标发票的识别

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

51 7 7

三分钟热度的鱼

4月前

存储文字识别运维

印刷文字识别使用问题之如何开通统一识别

三分钟热度的鱼

41 6 6

三分钟热度的鱼

4月前

文字识别容器

印刷文字识别使用问题之是否支持医疗检测报告识别

三分钟热度的鱼

51 6 6

三分钟热度的鱼

4月前

人工智能文字识别开发工具

印刷文字识别使用问题之是否支持识别并返回文字在图片中的位置信息

三分钟热度的鱼

37 1 1

三分钟热度的鱼

4月前

人工智能 JSON 文字识别

印刷文字识别使用问题之如何数电发票进行识别

三分钟热度的鱼

48 1 1

三分钟热度的鱼

4月前

文字识别数据安全/隐私保护 iOS开发

印刷文字识别使用问题之如何识别礼品册上的卡号、密码信息

三分钟热度的鱼

50 1 1

三分钟热度的鱼

4月前

机器学习/深度学习文字识别 API

印刷文字识别使用问题之是否支持识别香港和澳门食品经营许可证

三分钟热度的鱼

23 1 1

Tesseract-OCR安装及使用

热门文章

最新文章

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Tesseract-OCR安装及使用

热门文章

最新文章

相关电子书

相关实验场景