文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ocr识别的label_dict.txt编码为utf8，windows下默认以gbk读取，导致报错

在运行时，使用ocr识别的模型damo/cv_convnextTiny_ocr-recognition-general_damo，其读取的字典文件label_dict.txt的编码为utf-8，但是在windows下默认以gbk读取，导致报错，无法进行后续推理。请问官方能否将modelscope库中以下代码 with open(label_path, 'r') as f:
修改为例如： with open(label_path, 'r', encoding='utf8') as f: 的方式，明确指定以utf-8方式读取，以便解决默认发布的模型库问题？

展开

收起

老唐250 2022-11-15 13:46:01 819 版权

2 条回答

写回答

取消提交回答

游客mahexp74d6pzw

通常情况下，OCR识别的label_dict.txt文件应该使用UTF-8编码，而不是GBK编码。如果您的Windows系统默认使用GBK编码来读取该文件，可能会导致读取错误。

解决这个问题的方法是，将Windows系统的默认编码设置为UTF-8，以便正确读取label_dict.txt文件。您可以按照以下步骤进行操作：

打开“控制面板”，并选择“时间、语言和区域”。选择“区域和语言”，然后在弹出的窗口中，选择“更改时区”按钮。在“区域和语言设置”窗口中，选择“中文（中华人民共和国）”下的“详细信息”按钮。在“语言区域”下，选择“英语（美国）”并单击“确定”。现在将文件关闭，然后将标签_dict.txt复制到一个文本编辑器中，并将其保存为UTF-8编码。再次打开Windows资源管理器，您应该能够正确读取该文件了。如果以上方法无法解决问题，您可以尝试使用文本编辑器（如记事本）打开label_dict.txt文件，并将其另存为UTF-8编码。

2023-05-23 16:18:09

赞同展开评论
ModelScope答疑志愿者

谢谢反馈。这个问题已经在代码层面修复，下个版本发布能带上，敬请期待

2022-11-16 10:07:38

赞同展开评论

相关问答

计算机视觉

文字识别OCR中typescript接入ocr ，把示例弄下来代码报错了。可以帮忙瞅瞅吗？

155

2

0

智能语音交互Windows上是否可以使用实时识别C++SDK3.0

129

1

0

文字识别同样的图片为什么识别效果不同

184

1

0

文字识别报错unmatchedImageType

115

1

0

文字识别OCR报错:illegalCutType

162

1

0

OCR识别报错检测不到我的包，是为什么？

339

1

0

宜搭连接器调用阿里云ocr报错

221

1

0

阿里云 ocr 识别身份证报错为什么

262

1

0

文字识别OCR报错463是什么原因？

115

2

0

文字识别OCR这是啥意思？我在本地测试没啥问题，上线报错了。

112

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

macOS Sonoma 14.8.4 (23J319) Boot ISO 原版可引导映像下载

Windows Server 2016 中文版、英文版下载 (2026 年 2 月更新)

Windows Server 2016 OVF (2026 年 2 月更新) - VMware 虚拟机模板

Windows Server 2019 中文版、英文版下载 (2026 年 2 月更新)

Windows Server 2019 OVF (2026 年 2 月更新) - VMware 虚拟机模板

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

如何下载modelscope模型？

ModelScope下载速度慢怎么解决？

com/action/joingroup?code=v1是什么意思

在ModelScope中，下载模型时的ssl问题怎么解决？!

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

请问ModelScope这里是怎么进入粘贴模式的呀？

在ModelScope中，请问模型下载到本地的具体方法？

ModelScope魔搭上的可以直接调用api用吗？

展开全部

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

PSHuman：开源单图像3D人像重建技术，一张照片就能生成3D人像模型

HunyuanVideo：腾讯推出的开源视频生成模型，参数高达130亿

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

Cobalt：开源的流媒体下载工具，支持解析和下载全平台的视频、音频和图片，支持多种视频质量和格式，自动提取视频字幕

展开全部

还有其他疑问?