文字识别的搜索结果_文章_第5页-阿里云开发者社区

技术员阿伟

|

2月前

|

博文

|

本文聚焦大模型在高端装备制造企业智能文档解析系统的落地实践，针对领域术语理解断层、长文档上下文限制、知识提取精准度不足、响应缓慢、微调成本高、稳定性差等核心痛点，提出对应解决方案：构建领域术语知识底座适配行业语境，以语义分块+关联图谱突破长文档解析瓶颈，用多轮校验+规则库保障知识可靠性，通过分层部署+多级缓存优化响应速度，采用增量微调+prompt工程降低成本并提升泛化能力，依托全链路监控+自动化运维保障长期稳定。优化后，术语识别准确率、知识逻辑完整性显著提升，单文档初步解析响应缩至3秒内，故障发生率降至1.2%，印证大模型落地需全链路协同且贴合领域需求。

# 大模型服务平台百炼 # 缓存 # 运维 # 文字识别 # 自然语言处理 # 异构计算

技术员阿伟

|

2月前

|

博文

《大模型赋能文化遗产数字化：古籍修复与知识挖掘的技术实践》

本文记录大模型赋能文化遗产数字化的实践，针对古籍异体字识别难、残缺文本补全不准、隐性知识难挖掘、多模态数据割裂、中小机构部署难、知识难更新等痛点，提出对应方案：搭建古籍文字与语境知识库提升识别理解率，以多源史料关联与历史逻辑约束实现文本精准补全，构建多层级框架挖掘隐性知识，设计多模态语义对齐整合多元信息，通过轻量化优化与混合部署降低使用门槛，建立动态机制保障知识迭代。优化后多项关键指标显著提升，为古籍数字化提供有效路径。

# 文字识别 # 自然语言处理 # 数据处理 # 数据库 # 知识图谱

啦啦啦191

|

2月前

|

博文

Umi-OCR_文字识别工具免安装使用教程（附下载安装包）!永久免费，开源离线OCR识别软件下载

Umi-OCR是一款开源免费、支持离线运行的高精度OCR文字识别工具，基于深度学习技术，可快速识别中文、英文、日文等多种语言。无需联网，保护隐私，适用于Windows和Linux系统，解压即用，操作简便，是处理图片转文本的理想选择。

# 文字识别 # 机器学习/深度学习 # 文字识别 # Linux # Windows

游客ad6gaysewwv26

|

2月前

|

博文

有了AI叠buff，低代码行业在沉寂了一段时间后，好似又活过来了？

曾被质疑“难堪大用”的低代码平台，在AI驱动下正焕发新生。借助大模型，AI可理解自然语言、自动生成应用、智能补全数据、解析文档图表，大幅提升开发效率与业务响应速度。从“拖拉拽”到“你说我做”，低代码已迈入智能化时代，加速企业数字化转型。

# 人工智能 # 文字识别 # 自然语言处理 # 数据可视化 # JavaScript

老乡别走

|

2月前

|

博文

|

来自：视觉智能

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

针对铁路货运物流单存档需求，本项目基于WPF与飞桨OCR技术，实现批量图片多区域文字识别与自动重命名。用户可自定义识别区域，系统提取关键信息（如车号、批次号）并生成规范文件名，提升档案管理效率与检索准确性，支持PDF及图像文件处理。

# 视觉智能开放平台 # 机器学习/深度学习 # 文字识别 # Shell # C# # Python

aliyun9170107523-43660

|

2月前

|

博文

31_NLP数据增强：EDA与NLPAug工具

在自然语言处理（NLP）领域，高质量的标注数据是构建高性能模型的基础。然而，获取大量准确标注的数据往往面临成本高昂、耗时漫长、覆盖度不足等挑战。2025年，随着大模型技术的快速发展，数据质量和多样性对模型性能的影响愈发显著。数据增强作为一种有效扩充训练样本的技术手段，正成为解决数据稀缺问题的关键策略。

# 数据采集 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 文字识别

modelscope

|

3月前

|

博文

|

来自： ModelScope模型即服务

PDF解析迎来技术革新！阿里新产品实现复杂文档端到端结构化处理

前言9月24日云栖大会现场，由阿里巴巴爱橙科技数据技术及产品团队自主研发的 PDF解析神器正式亮相并同步开源模型。这款基于Logics-Parsing模型构建的AI工具直指当前PDF解析领域的技术痛点，显著提升复杂文档的结构…

# 云解析DNS # 存储 # 人工智能 # 文字识别 # 数据可视化 # 云栖大会

技术员阿伟

|

3月前

|

博文

《法务RAG开发不踩坑：Kiln+LlamaIndex+Helicone的协同方法指南》

本文记录企业级法务知识库RAG系统的多AI协同开发实战：面对2万份格式混杂、含15%模糊扫描件的法律文档，14天交付需3秒响应精准查询的系统，构建Kiln AI、LlamaIndex、Helicone协同矩阵。Kiln AI完成数据清洗（有效信息密度提至85%）、合成训练样本及模型微调，使专业术语识别准确率达92%；LlamaIndex搭建三层检索架构，融合语义与关键词检索，匹配错误率降至5%，响应时间缩至2.1秒；Helicone优化提示词与推理监控，输出规范率达97%。

# 数据采集 # 人工智能 # 文字识别 # 监控 # 数据处理

聚客AI

|

3月前

|

博文

|

来自：阿里云百炼

从CLIP到GPT-4V：多模态RAG背后的技术架构全揭秘

本文深入解析多模态RAG技术，涵盖其基本原理、核心组件与实践路径。通过整合文本、图像、音频等多源信息，实现跨模态检索与生成，拓展AI应用边界。内容详实，建议收藏学习。

# 数据采集 # 人工智能 # 文字识别 # 数据库 # 索引

阿里云开发者

|

3月前

|

博文

你们催更的模型，云栖大会一口气全发了！

通义发布6款全新模型及“通义百聆”语音品牌，覆盖文本、视觉、语音、视频、代码、图像全场景。Qwen系列升级显著提升多模态理解与生成能力，Wan2.5支持音画同步，百聆攻克企业语音落地难题，全面赋能AI应用创新。

# 人工智能 # 自然语言处理 # 文字识别 # 云栖大会 # 语音技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别