文档备案控制台

开发者社区问答正文

ModelScope中分词模型输入128个字符会报错请问这里是限制字符长度有问题还是模型内问题？

ModelScope中分词模型输入128个字符会报错，无论是网页上还是本地运行都会，请问这里是限制字符长度有问题还是模型内tensor问题？

展开

收起

fuxixi 2022-12-26 12:04:09 343 版权

来自：阿里云开发者学堂

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

宇航员w

BERT分词模型默认的tokenizer长度是128，分词输入的时候前后添加一个特殊字符的padding, 所以默认能支持的最大长度是128-2=126；长度需要增加的话可以在modelScope的代码里面修改，参考: https://github.com/modelscope/modelscope/blob/master/modelscope/preprocessors/nlp/token_classification_preprocessor.py#L223，但是最长不能超多BERT输入的最大长度512。此答案整理自钉钉群“魔搭ModelScope开发者联盟群 ①”

2022-12-26 20:54:22

赞同展开评论

问答分类：

自然语言处理

问答标签：

modelscope模型 modelscope报错 modelscope模型报错 modelscope字符 modelscope字符报错

问答地址：

开发者社区 > 阿里云开发者学堂 > 问答

相关问答

llamaindex整合modelscope本地模型，启动报错

726

1

0

modelscope这个报错呢怎么回事？在参数里加上encoding=utf-8，又会出现这个报错

279

1

0

问下ModelScope哈智能体默认是可以接收多少提问字符，回答字符是多少呀？

190

1

0

modelscope-funasr执行sencevoice后报错怎么解决？

311

0

0

modelscope-funasr这个报错是什么问题？

225

1

0

modelscope里做了个简单的例子，出现报错怎么处理呀？

293

1

0

ModelScope中qwen为什么不支持寻常其他大模型都支持的特殊字符？

294

1

0

在modelscope-funasr中finetune.sh脚本，中间报错如何解决？

232

0

0

ModelScope社区有文字识别提取（ocr）的模型吗？

204

1

0

modelscope的finetune模型有没有什么快速有效的方法？

175

0

0

收录在圈子:

阿里云开发者学堂

131288

+ 订阅

技术图谱：由专家组参与技术图谱的绘制与编写，知识与实践的结合让开发者们掌握学习路线与逻辑，快速提升技能电子书：电子书由阿里内外专家打造，供开发者们下载学习，更与课程相结合，使用户更易理解掌握课程内容训练营：学习训练营深入浅出，专家授课，带领开发者们快速上云精品课程：汇集知识碎片，解决技术难题，体系化学习场景，深入浅出，易于理解技能自测：提供免费测试，摸底自查体验实验室：学完即练，云资源免费使用

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

阿里云服务器多少钱一年？支持40个连接的配置

阿里云服务器多少钱一年企业用？公司用什么配置？

阿里云服务器多少钱一年？企业用的配置费用价格

阿里云服务器多少钱一年？学生用的配置价格

相关文章

AI 技术在英语教育中的应用

阿里云Qwen3.7-Max接入百炼大模型服务流程：API 调用、Token Plan订阅两种接入方式流程参考

从一次修复到长期记忆：Agent 工作流里的知识沉淀

医院陪护系统源码如何快速搭建智慧陪护平台？

指标口径治理实践：从业务语义层到 AI 辅助分析

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

一键训练模型及部署GPU共享推理服务

还有其他疑问?