文本,文字识别07,SpringBoot服务开发-入参和返回值,编写接口的时候,要注意识别的文字返回的是多行,因此必须是List集合,Bean层,及实体类的搭建

本文涉及的产品
自定义KV模板,自定义KV模板 500次/账号
个人证照识别,个人证照识别 200次/月
教育场景识别,教育场景识别 200次/月
简介: 文本,文字识别07,SpringBoot服务开发-入参和返回值,编写接口的时候,要注意识别的文字返回的是多行,因此必须是List集合,Bean层,及实体类的搭建

设置Application的文件,设置/ocr,这里的意思是设置根路径的意思

之后写一下接口参数和Java所对应的Bean,

这里设置一个类OcrParm,application.yml文件中进行配置

1. /*设置根路径*/
2. server:
3.   port: 9090
4.   servlet:
5.     context-path: /ocr

OcrParam这里的实体类配置成这样,新建一个OcrParam的类

这里在dto开始编写实体类

TextOctDto

TextOctDto类的相关配置

在TextOctDto中添加注解

TextOctDto中添加text

接下来,接入文本框的APO

创建TextAccuracyOcrDto

TextAccuracyOcrDto一个创建文本,一个可信度

package file.pojo.dto;
 
import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;
 
@NoArgsConstructor
@AllArgsConstructor
@Data
public class TextAccuracyOcrDto {
    /**
     * 识别文本
     */
    private String text;
    /**
     * 识别可信度
     */
    private String accuracy;
}

再创建一个文本和字符位置的实体类

再创建一个新的Dto,TextAccuracyLocationDto

这里width代表x和y坐标

我们需要一个新的对象去构造,去构造位置对象,OcrPoint

package zero.file.videoProject.controller;
 
import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestBody;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
import zero.file.videoProject.bean.dto.TextOcrDto;
import zero.file.videoProject.bean.param.OcrParam;
 
import java.util.List;
 
@RestController
@RequestMapping("/text")
public class OctTextController {
    @PostMapping("/text-only")
    public List<List<TextOcrDto>> textOnly(@RequestBody OcrParam ocrParam){
        // Todo 调用识别服务
    }
}

x和y有两个值,写成这样就行

由于我们需要四个点来返回坐标,Mapper的key用来代替是那个点,另一个是路径

这里添加无参构造和有参构造的方法

接下来我们在controller层中编写接口

编写Controller

@RequestBody表示携带参数,把他放到List里

1. package zero.file.videoProject.controller;
2. 
3. import org.springframework.web.bind.annotation.PostMapping;
4. import org.springframework.web.bind.annotation.RequestBody;
5. import org.springframework.web.bind.annotation.RequestMapping;
6. import org.springframework.web.bind.annotation.RestController;
7. import zero.file.videoProject.bean.dto.TextOcrDto;
8. import zero.file.videoProject.bean.par
相关文章
|
1月前
|
机器学习/深度学习 人工智能 文字识别
Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答
k1视觉思考模型是kimi推出的k1系列强化学习AI模型,具备端到端图像理解和思维链技术,能够在数学、物理、化学等领域表现优异。本文详细介绍了k1视觉思考模型的功能、技术原理、使用方法及其在多个应用场景中的表现。
206 68
Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答
|
13天前
|
编解码 文字识别 自然语言处理
如何使用OCR技术批量识别图片中的文字并重命名文件,OCR 技术批量识别图片中的文字可能出现的错误
### 简介 【批量识别图片内容重命名】工具可批量识别图片中的文字并重命名文件,方便高效处理大量图片。然而,OCR 技术面临字符识别错误(如形近字混淆、生僻字识别不佳)、格式错误(段落错乱、换行问题)和语义理解错误等挑战。为提高准确性,建议提升图片质量、选择合适的 OCR 软件及参数,并结合自动校对与人工审核,确保最终文本的正确性和完整性。
65 12
如何使用OCR技术批量识别图片中的文字并重命名文件,OCR 技术批量识别图片中的文字可能出现的错误
|
18天前
|
人工智能 文字识别 自然语言处理
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
Vision Parse 是一款开源的 PDF 转 Markdown 工具,基于视觉语言模型,能够智能识别和提取 PDF 中的文本和表格,并保持原有格式和结构。
96 19
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
|
3月前
|
存储 算法 安全
SpringBoot 接口加密解密实现
【10月更文挑战第18天】
|
2月前
|
Java 开发者 Spring
精通SpringBoot:16个扩展接口精讲
【10月更文挑战第16天】 SpringBoot以其简化的配置和强大的扩展性,成为了Java开发者的首选框架之一。SpringBoot提供了一系列的扩展接口,使得开发者能够灵活地定制和扩展应用的行为。掌握这些扩展接口,能够帮助我们写出更加优雅和高效的代码。本文将详细介绍16个SpringBoot的扩展接口,并探讨它们在实际开发中的应用。
62 1
|
3月前
|
存储 安全 Java
|
3月前
|
监控 Java 开发者
掌握SpringBoot扩展接口:提升代码优雅度的16个技巧
【10月更文挑战第20天】 SpringBoot以其简化配置和快速开发而受到开发者的青睐。除了基本的CRUD操作外,SpringBoot还提供了丰富的扩展接口,让我们能够更灵活地定制和扩展应用。以下是16个常用的SpringBoot扩展接口,掌握它们将帮助你写出更加优雅的代码。
126 0
|
3月前
|
存储 NoSQL Java
Spring Boot项目中使用Redis实现接口幂等性的方案
通过上述方法,可以有效地在Spring Boot项目中利用Redis实现接口幂等性,既保证了接口操作的安全性,又提高了系统的可靠性。
81 0
|
druid Java 应用服务中间件
【SpringBoot】Bean属性绑定
SpringBoot自定义Bean属性绑定、第三方Bean属性绑定、松散绑定、Bean的属性校验
378 0
【SpringBoot】Bean属性绑定
|
3月前
|
JavaScript 安全 Java
如何使用 Spring Boot 和 Ant Design Pro Vue 实现动态路由和菜单功能,快速搭建前后端分离的应用框架
本文介绍了如何使用 Spring Boot 和 Ant Design Pro Vue 实现动态路由和菜单功能,快速搭建前后端分离的应用框架。首先,确保开发环境已安装必要的工具,然后创建并配置 Spring Boot 项目,包括添加依赖和配置 Spring Security。接着,创建后端 API 和前端项目,配置动态路由和菜单。最后,运行项目并分享实践心得,包括版本兼容性、安全性、性能调优等方面。
215 1

热门文章

最新文章