文字识别的搜索结果_第12页-阿里云开发者社区

34789737

|

6月前

|

博文

熊猫 OCR 识别软件下载，支持截图 OCR、PDF 识别、多语言翻译的免费全能工具，熊猫OCR识别

本文介绍了几款实用的图文识别软件，包括熊猫OCR、Umi-OCR和天若OCR_本地版。熊猫OCR功能强大，支持多窗口操作、AI找图找色、OCR识别等；Umi-OCR免费且高效，具备截图OCR、批量处理等功能；天若OCR界面简洁，适合快速文字识别。文章还提供了下载链接及软件特点、界面展示等内容，便于用户根据需求选择合适的工具。

# 人工智能 # 文字识别 # 自然语言处理 # 小程序 # API

程序元宝

|

6月前

|

博文

|

来自：大数据与机器学习

2025年颠覆闭源大模型？MonkeyOCR：这款开源AI文档解析模型，精度更高，速度更快！

还在依赖昂贵且慢的闭源OCR工具？华中科技大学开源的MonkeyOCR文档解析模型，以其超越GPT4o的精度和更快的推理速度，在单机单卡（3090）上即可部署，正颠覆业界认知。本文将深入解析其设计哲学、核心突破——大规模自建数据集，并分享实测体验与避坑指南。

# 数据采集 # 人工智能 # 编解码 # 文字识别 # 算法

modelscope

|

6月前

|

博文

|

来自： ModelScope模型即服务

Nanonets-OCR-s开源！复杂文档转Markdown SoTA，颠覆复杂文档工作流

Nanonets团队开源了 Nanonets-OCR-s，该模型基于Qwen2.5-VL-3B微调，9G显存就能跑。

# 存储 # 人工智能 # 文字识别 # 数据安全/隐私保护 # 异构计算

阿里云-分析师关系团队

|

6月前

|

博文

亚太唯一，阿里云实人认证获权威机构认可

Forrester公司发布IDV趋势报告《The State Of Identity Verification In The Financial Services Industry》(April 2, 2025)，阿里云IDV暨金融级实人认证产品在报告的知名实践案例中被收录。

# 实人认证 # 人工智能 # 文字识别 # 安全 # 算法 # 开发工具

游客u6vcprrm3r23y

|

6月前

|

博文

鸿蒙5开发宝藏案例分享---AI辅助图文内容高效编创

本案例展示HarmonyOS在AI图文编创领域的实战应用，通过跨设备协同与智能处理提升创作效率。核心功能包括：自由流转（多设备无缝切换编辑）、服务互通（跨设备调用相机/相册）和鸿蒙智能（AI抠图+文字识别）。开发者可学习关键代码实现，如图片选择器、AI分析器、动图拍摄及跨设备相机调用等，同时规避常见开发坑点，大幅缩短开发时间。适合想深入了解HarmonyOS跨端协同与AI能力的开发者参考实践。

# 人工智能 # 文字识别 # 开发者

modelscope

|

6月前

|

博文

|

来自： ModelScope模型即服务

UGPhysics：本科物理推理评估基准发布，助力AI+Physics交叉研究

近年来，人工智能快速发展，大语言模型（LLM）在数学、代码等领域展现出强大的推理和生成能力，正在被广泛应用于各种场景。

# 机器学习/深度学习 # 人工智能 # 文字识别 # 数据挖掘

王导为

|

6月前

|

博文

我用 Python 写了一个自动裁剪答题卡区域的小工具（附代码）

本文分享了一种通过 OpenCV 自动裁剪答题卡中答题区域的方法。核心思路是利用答题区域四周的黑色角块进行定位：先通过自适应阈值增强对比度，再用 `cv2.findContours()` 找轮廓，并计算每个轮廓的“紧凑度”（面积 / 周长）筛选出接近方块的角块。最终根据四个角块的边界矩形裁剪出答题区。代码实现详细，适合初学者参考，同时提供了参数调整建议以适配不同图像条件。

# 文字识别 # 计算机视觉 # Python

modelscope

|

6月前

|

博文

|

来自： ModelScope模型即服务

趣丸千音MCP首发上线魔搭社区，多重技术引擎，解锁AI语音无限可能

近日，趣丸千音（All Voice Lab）MCP正式首发上线魔搭社区。用户只需简单文本输入，即可调用视频翻译、TTS语音合成、智能变声、人声分离、多语种配音、语音转文本、字幕擦除等多项能力。

# 人工智能 # 文字识别 # 安全 # API # 语音技术

yunmai

|

6月前

|

博文

OCR技术在政务领域的革新与趋势

OCR（光学字符识别）技术正深刻变革政务领域。从证件识别到文档电子化，从打破数据孤岛到深度学习驱动的技术革新，OCR极大提升了政务服务效率与精准度。未来，随着与自然语言处理、大数据等技术融合，OCR将提供更综合、高效的解决方案，助力政务数字化转型，实现服务升级与创新突破。

# 机器学习/深度学习 # 存储 # 文字识别 # 自然语言处理 # 大数据

小华同学ai

|

6月前

|

博文

AI新宠DocExt：纯本地文档抽取，开源免费还无依赖！你还在为OCR头疼吗？

DocExt 是一款开源、免费的本地文档结构化提取工具，无需依赖 OCR 或云端服务，通过视觉语言模型（VLM）实现票据、护照、发票等多类型文档的关键字段与表格识别。支持多页文档处理、置信度量化及本地部署，提供直观的 Gradio Web 界面和灵活的 API 调用方式，适配高隐私场景如金融、医疗等领域。项目参与 IDP Leaderboard 评测，具备零模板限制和多模型支持等优势，是处理敏感文件的理想选择。

# 人工智能 # JSON # 文字识别 # API # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别