文档备案控制台

开发者社区 ModelScope模型即服务多模态正文

使用ofa的ocr模型识别手写体文字时，怎么增加vocab.txt中没有的字

在使用ofa的ocr模型识别手写体文字时，怎么增加vocab.txt中没有的字，因为模型自带的只有5000+文字，我想增加到近20000字，我使用的add_tokens方法，但推理时报如下错误

不知如何处理。感谢各位大神

展开

收起

OFA文字识别-中文-通用场景-base

7q53djewhjqbu 2024-01-30 14:35:19 326 版权

1 条回答

写回答

取消提交回答

1941623231718325
解决这个问题，你可以尝试以下步骤：
1. 确保你已经正确地将新字符添加到了词汇表文件（vocab.txt）。请检查文件中的字符顺序和数量是否与你期望的一致。
2. 更新模型配置文件（config.yaml），确保词汇表大小与vocab.txt中的字符数量匹配。例如，如果你的vocab.txt中有近20000个字符，则需要将配置文件中的vocab_size设置为20000。
3. 使用更新后的配置文件重新加载模型。这将确保模型知道新的词汇表大小，并能够正确处理输入。
4. 检查输入数据的形状是否与模型的预期输入形状匹配。根据你提供的错误信息，输入形状 [1, -1, 30373] 不符合模型的预期。请确保输入数据的形状正确无误。
2024-01-30 14:47:06

赞同展开评论

相关问答

文字识别OCR有没有手写离线版的图片转文字 Android版的sdk？

261

2

0

这个营业执照OCR文字识是识别成功计费吗，还是按照识别次数计费？

269

2

0

调用【身份证OCR文字】接口返回403(Forbidden)

468

0

0

在文字识别OCR中，请教一个关于通过pdf文字识别获得文字后如何结构化整理的问题?

284

1

0

文字识别OCR的24978模型在线体验报错如何解决？

230

0

0

在文字识别OCR中程序怎么替换图片中指定部分文字?

222

0

0

文字识别OCR模型ID:24711训练报错，怎么解决？

198

0

0

文字识别OCR 识别越南银行凭证提取凭证图片的文字调用哪个接口吗？

195

1

0

文字识别OCR 这种图片的文字能识别吗？

217

1

0

我在训练身份证反面的文字识别OCR模型，训练出来的模型为什么只能识别横向拍的照片？竖着拍的识别不出来

294

1

0

ModelScope模型即服务

多模态

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

我要提问

相关文章

AI 流量增长≠GEO 投入有效：如何用五级因果证据阶梯说服 CFO？

2026年AI融合RPA能替代哪些工作？企业财务运营自动化真实使用体验

二维码钓鱼攻击演进与邮件安全多层防御体系研究

电信入网人脸识别实名新规下活体抗欺诈多层风控体系研究

祁木CAD Translator 原理拆解：基于百炼云技术的DWG/DXF工程图纸结构化翻译技术解析

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

Qwen-Image，生图告别文字乱码

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

热门讨论

热门文章

通过ollama 编写modelfile的形式创建翻译模型，输出全是思考，老是超限，翻译不出来。

下载youku-mplug的Video Captioning数据集时报错。

怎么修改model scope的默认存储位置

普通轻薄本能跑哪些多模态大模型

该模型在在线环境使用下运行报错。

!pip install open_clip_torch !pip install pytorch-

中文CLIP模型卷土重来，这次加量不加价！

你好，在官方提供的实例上运行，报了下图错误。即使把modelscope库更新到1.8.4还是存在问题

关于qwen2-vl微调最佳实践

关于存储路径

展开全部

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

阿里开源AI视频生成大模型 Wan2.1：14B性能超越Sora、Luma等模型，一键生成复杂运动视频

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

AnythingLLM：34K Star！一键上传文件轻松打造个人知识库，构建只属于你的AI助手，附详细部署教程

AstrBot：轻松将大模型接入QQ、微信等消息平台，打造多功能AI聊天机器人的开发框架，附详细教程

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

video-subtitle-master：开源字幕生成神器！批量生成+AI翻译全自动，5分钟解放双手

用自然语言控制电脑，字节跳动开源 UI-TARS 的桌面版应用！内附详细的安装和配置教程

展开全部

还有其他疑问?