利用Tess4J实现图片识别

简介: 一、下载1.进入官网下载页面https://sourceforge.net/projects/tess4j/ 2.点击download 3.下载后解压,目录如下,圈出的三个文件夹是需要用到的 二、使用Tess4J1.

 

一、下载

1.进入官网下载页面

https://sourceforge.net/projects/tess4j/

 

2.点击download

 

3.下载后解压,目录如下,圈出的三个文件夹是需要用到的

 

二、使用Tess4J

1.将dist和lib下的包导入java项目

 

2.将 tessdata 文件夹复制进项目的根目录

 

3.示范代码如下

public class OCRDemo {

    public static void main(String[] args) {
        try {
            double start=System.currentTimeMillis();
            File imageFile = new File("C:\\Users\\dan\\Desktop\\12345.png");//图片位置
            ITesseract instance = new Tesseract();
            //instance.setDatapath("");//设置tessdata位置
            instance.setLanguage("chi_sim");//选择字库文件
            String result = instance.doOCR(imageFile);//开始识别
            double end=System.currentTimeMillis();
            System.out.println(result);//打印图片内容
            System.out.println("耗时"+(end-start)/1000+" s");
        } catch (TesseractException e) {
            e.printStackTrace();
        }
    }

}

注意事项:

①如果tessdata没有放入根目录,务必设置teedata的位置

instance.setDatapath("");//设置tessdata位置

②选择字库文件不需要写上后缀,默认 tessdata 包中可能没有 chi_sim 这个中文包,需要自己下载

https://github.com/tesseract-ocr/tessdata

 

三、运行结果

 

官方字库识别率还是偏低的,如果对精度要求高的话需要自己训练字库了

相关文章
|
文字识别 Java API
SpringBoot+Tess4j实现牛逼的OCR识别工具
SpringBoot+Tess4j实现牛逼的OCR识别工具
1716 0
SpringBoot+Tess4j实现牛逼的OCR识别工具
|
文字识别 Java C++
Tesseract-OCR的简单使用与训练
Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。
5928 0
|
8月前
|
文字识别 Android开发 C++
Tesseract OCR集成Android Studio实现OCR识别
Tesseract OCR集成Android Studio实现OCR识别
389 0
|
9月前
|
文字识别 Java Maven
java调用tess4j识别图像中的文字
java调用tess4j识别图像中的文字
414 3
|
9月前
|
文字识别 Java
Java使用Tess4j识别图片里的文字
Java使用Tess4j识别图片里的文字
|
人工智能 文字识别 Java
java实现文字识别营业执照识别(百度、讯飞)
工作中遇到一个需求是识别营业执照,看了阿里云的,腾讯云的,讯飞的,百度的。然后发现阿里云和腾讯云目前都是公测或者内测阶段,所以就去试了百度的,但是百度的只是普通的文字识别,就是识别文字中的图片,而讯飞的就比较专业了,单纯的识别营业执照。
|
文字识别 Java Spring
JavaCV不到十行代码实现图片OCR文字识别
JavaCV不到十行代码实现图片OCR文字识别
596 0
|
算法 Java TensorFlow
JavaCV 实现图片中人脸检测完整代码教程
JavaCV 实现图片中人脸检测完整代码教程
387 0
|
测试技术 计算机视觉 Python
项目实战 | YOLOv5 + Tesseract-OCR 实现车牌号文本识别
项目实战 | YOLOv5 + Tesseract-OCR 实现车牌号文本识别
项目实战 | YOLOv5 + Tesseract-OCR 实现车牌号文本识别
Tesseract-OCR安装及使用
Tesseract-OCR安装及使用
Tesseract-OCR安装及使用