DALL-E | |
---|---|
[[Ficheiro:![]() Imaxe xerada por DALL-E a partir do prompt (indicación de texto) "Teddy bears working on new AI research underwater with 1990s technology" | |
Autor orixinal | OpenAI |
Lingua/s | Linguas presentes en Internet. Páxina oficial en inglés. |
Tipo | Modelo de texto a imaxe |
Sitio web | labs |
DALL-E (estilizado como DALL·E ), DALL-E 2 e DALL-E 3 son modelos de aprendizaxe automática desenvolvidos por OpenAI para xerar imaxes dixitais a partir de descricións en linguaxe natural. DALL-E foi revelado por OpenAI nunha publicación de blog en xaneiro de 2021 e usa unha versión de GPT-3 modificada para xerar imaxes. En abril de 2022, OpenAI anunciou DALL-E 2, un sucesor deseñado para xerar imaxes máis realistas a resolucións máis altas que "poden combinar conceptos, atributos e estilos".[1]
OpenAI non lanzou código fonte para ningún dos modelos, aínda que a saída dunha selección limitada de indicacións (prompts) de mostra está dispoñible no sitio web de OpenAI desde o 20 xullo 2022, DALL-E 2 entrou nunha fase beta con invitacións enviadas a 1 millón de persoas na lista de espera.[2] [3] Antes, o acceso estaba restrinxido aos usuarios preseleccionados para unha vista previa da investigación debido a problemas relacionados coa ética e a seguridade.[4] [5] A pesar diso, outros lanzaron varias imitacións de código aberto adestradas en pequenas cantidades de datos, como Craiyon ou Midjourney.[6] O 28 de setembro de 2022 OpenAI anunciou que DALL-E estaba á disposición dos usuarios sen necesidade de esperar na lista de agarda.[7]
O nome do software é unha combinación dos nomes do personaxe do robot animado de Pixar WALL-E e do artista surrealista Salvador Dalí.