热门
专家您好,在VQA的任务里,我的text中,有没有特殊的的字符可以告诉模型,一部分句子是我提供的context,一部分句子是我真正想要问的问题 比如 Context: There are 5 people rising their bottles. Q: How many bottes?
您好,目前没有办法区分context和question,当前的vqa是按照标准vqa数据集构造的。
包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域