DALL·E

Created
TagsNN

two stage: prior and decoder

prior: 根据文本生成image embedding

decoder: 根据image embedding生成图像

相比较于GAN,更加多样,有创造力

zero-shot 不需要预训练

prior和decoder都是diffusion model

Previous work:

Not stable

VAE, VQVAE

Dalle:

Diffusion model:

Classifier guided diffusion

Classifier free guidance- GLIDE

Dalle-2

Prior, hierarchical