文字识别的搜索结果_热门_第11页-阿里云开发者社区

老乡别走

|

博文

|

分享：如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用，图片批量识别转excel表格的方法

该软件是一款OCR身份证识别工具，能批量处理图片，自动提取身份证信息并导出为Excel。支持百度网盘和腾讯云盘下载。用户界面直观，操作简单，适合新手。识别过程包括：打开图片、一键识别、导出结果。特别注意，此程序仅适用于身份证识别，不适用于其他类型的图片识别。

# 视觉智能开放平台 # 文字识别

blackswan_xdu-25928

|

博文

|

来自：通义大模型

Qwen2-VL微调实战：LaTex公式OCR识别任务（完整代码）

《SwanLab机器学习实战教程》推出了一项基于Qwen2-VL大语言模型的LaTeX OCR任务，通过指令微调实现多模态LLM的应用。本教程详述了环境配置、数据集准备、模型加载、SwanLab集成及微调训练等步骤，旨在帮助开发者轻松上手视觉大模型的微调实践。

# JSON # 文字识别 # 数据可视化 # 物联网 # 数据格式

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Vision Parse：开源的 PDF 转 Markdown 工具，结合视觉语言模型和 OCR，识别文本和表格并保持原格式

Vision Parse 是一款开源的 PDF 转 Markdown 工具，基于视觉语言模型，能够智能识别和提取 PDF 中的文本和表格，并保持原有格式和结构。

# 图像识别 # 自然语言处理 # 人工智能 # 文字识别 # 自然语言处理 # API # Python

游客3g2isv2zt6tuw

|

5月前

|

博文

自动识别图片点击脚本，文字识别自动点击器，能识别屏幕内容并自动点击

本方案采用OCR文字识别+图像匹配双模式识别技术： OCR引擎识别屏幕文字内容 OpenCV模板匹配识别图形元素 PyAutoGUI实现

# 文字识别 # JSON # 文字识别 # 并行计算 # 计算机视觉 # Python

不是海碗

|

博文

一文带你看透IP归属地

IP归属地查询在各大行业当中的利用率可以说非常的高了，提供了各种的保障，比如安全保障、数据保障、性能保障等等。在这就可以推荐使用APISpace的IP归属地服务，上面各行业的应用场景都是可以很好的覆盖到。

# 云解析DNS # 数据采集 # 文字识别 # 网络协议 # 安全 # 视频直播 # 定位技术 # API # 调度 # 数据中心 # CDN

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

pdf-craft：PDF秒转Markdown/EPUB！接入DeepSeek轻松生成电子书，自动整理目录、注释和引文

pdf-craft是一款专注于处理扫描书籍PDF的开源工具，能精准提取正文内容并转换为Markdown/EPUB格式，通过AI算法解决跨页连贯性问题，是学术研究和电子书制作的利器。

# 自然语言处理 # 存储 # 人工智能 # 文字识别 # 算法 # 异构计算

modelscope

|

6月前

|

博文

|

来自： ModelScope模型即服务

小米又放大招！MiMo-VL 多模态大模型开源，魔搭推理微调全面解读来了！

今天，小米开源发布两款 7B 规模视觉-语言模型 MiMo-VL-7B-SFT 和 MiMo-VL-7B-RL。

# 机器学习/深度学习 # 编解码 # 文字识别 # 自然语言处理 # 测试技术

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

moonshot-v1-vision-preview：月之暗面Kimi推出多模态视觉理解模型，支持图像识别、OCR文字识别、数据提取

moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型，具备强大的图像识别、OCR文字识别和数据提取能力，支持API调用，适用于多种应用场景。

# 文字识别 # 图像识别 # 人工智能 # 文字识别 # API # Python

琛琛轴子

|

博文

阿里云智能达摩院AI产品矩阵

“人工智能”已经成为了大家耳熟能详的词汇。如今，AI不再只是“能够在围棋比赛中战胜世界冠军”的技术了，人们对于它有了更多的期许。而在AI技术原子能力和产业落地产生的商业价值之间存在着必然的鸿沟，如何弥补这一鸿沟，为AI技术的终端用户产生真正的价值？本文中，达摩院机器智能实验室资深算法专家高杰将为大家分享他的观点。

# 文字识别 # 智能语音交互 # 自然语言处理 # 人工智能平台 PAI # 客服工作台 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 达摩院 # 自然语言处理 # 文字识别 # 算法 # 机器人 # 语音技术 # 双11 # 决策智能

三分钟热度的鱼

|

问答

|

来自：视觉智能

文字识别OCR识别失败是因为什么？报错 code 464

# 文字识别 # 视觉智能开放平台 # 文字识别

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别