备案控制台

开发者社区 > 大数据与机器学习 > 正文

求助transformers库的大模型BLIP2的程序错误是怎么回事？

程序源码如下：
from transformers import Blip2ForConditionalGeneration, AutoTokenizer, AutoProcessor
model_name='model/Salesforce_blip2-opt-2.7b'
model = Blip2ForConditionalGeneration.from_pretrained(model_name)
processor = AutoProcessor.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
model.eval()

# 评估循环
for batch in dataloader:
    images, reports, _ = batch
    images = images.to(device)

    # 使用processor处理输入
    inputs = processor(images=images, text=reports, padding=True, truncation=True, return_tensors="pt").to(device)

    # 前向传播
    with torch.no_grad():
        outputs = model.generate(**inputs)

以上程序执行后错误如下：
outputs = model.generate(**inputs)
File "D:\anaconda3\envs\llava\lib\site-packages\peft\peft_model.py", line 647, in generate
return self.get_base_model().generate(args, **kwargs)
File "D:\anaconda3\envs\llava\lib\site-packages\torch\utils_contextlib.py", line 115, in decorate_context
return func(args, **kwargs)
File "D:\anaconda3\envs\llava\lib\site-packages\transformers\models\blip_2\modeling_blip_2.py", line 2316, in generate
inputs_embeds[special_image_mask] = language_model_inputs.flatten()
RuntimeError: shape mismatch: value tensor of shape [2621440] cannot be broadcast to indexing result of shape [0]

哪位大牛能给解释一下这是怎么回事呀？谢谢！

展开

收起

游客ijsp4ghgv6ufc 2024-12-12 21:00:59 98 0

0 条回答

写回答

取消提交回答

问答地址：

开发者社区 > 大数据与机器学习 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

this xml file does not appear to have any style in

35415

8

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

235100

10

0

如果购买了域名，一定要备案才能用吗

38388

36

0

com/action/joingroup?code=v1是什么意思

207869

20

0

OSS的endpoint如何查看

30551

3

0

有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎？

95220

16

0

配置了安全组规则，端口还是无法访问

28200

21

0

企业邮箱

9120

7

0

什么是红帽认证？

3012

1

0

建设网站

3935

2

0

大数据与机器学习

大数据领域前沿技术分享与交流，这里不止有技术干货、学习心得、企业实践、社区活动，还有未来。

我要提问

热门讨论

热门文章

Flink mysql cdc全量阶段现在支持select *字段自定义吗？

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

在海量用户中，将如何快速定位到目标人群进行个性化营销？

AI生成海报or人工手绘，哪个更戳你？

幻兽帕鲁服务器搭建

通义千问语音识别大模型API 本地上传报错 InvalidParameter问题如何解决？

DataWorks中78xxxxx_out的输出是什么?

DataWorks我该如何访问A项目安装了项目的package资源？

数据来源：com.alibaba.fastjson.JSONException: syntax er

机器学习PAI有没有类似colab这种免费的在线Notebook代码编辑运行环境啊？

展开全部

数据库开放权限太危险，又不想写API。DataV给你另外一个选择。

ajax请求总是不成功？浏览器的同源策略和跨域问题详解

数据仓库介绍与实时数仓案例

OpenAI如何让ChatGPT遵守了伦理道德的底线

MaxCompute上如何处理非结构化数据

倒计时1天！相约杭州云栖，相遇数据智能

5W1H(六何分析法)全景洞察大数据

广告场景下的实时计算

MaxCompute访问TableStore(OTS) 数据（20170601更新）

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

展开全部

相关电子书

更多

低代码开发师（初级）实战教程 立即下载

冬季实战营第三期：MySQL数据库进阶实战 立即下载

阿里巴巴DevOps 最佳实践手册 立即下载