学术#生成模型#论文分享论文分享 - BLIP22023/02/09BLIP2是一个基于预训练语言、视觉模型的VL Pretrain模型,能zero-shot地做VQA、Image Captioning、Image Text Retrieval任务。