EMMA

在完成 ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment 这个工作后,我的目标变成了轻量廉价地将 Stable Diffusion 系列模型改造成图文交叉序列作为控制条件的图片生成模型。我尝试了多种 MLLM …...