Stable Diffusion

Stable Diffusion
	由Stable Diffusion根据文本提示“a photograph of an astronaut riding a horse”生成的图像
原作者	Runway、CompVis、Stability AI
開發者	Stability AI
首次发布	2022年8月22日
当前版本	3.5（2024年10月23日）;
源代码库	github.com/Stability-AI/generative-models;
编程语言	Python
操作系统	任何支持CUDA內核函數的操作系統
类型	文本到图像生成模型
许可协议	CreativeML Open RAIL-M;
网站	stability.ai/stable-image

Stable Diffusion是2022年發布的深度學習文本到图像生成模型。它主要用於根據文本的描述產生詳細圖像，儘管它也可以應用於其他任務，如內補繪製、外補繪製，以及在提示詞指導下產生圖生圖的转变。^[2]

它是一種潛在（英语：Latent variable model）擴散模型，由慕尼黑大學的CompVis研究團體開發的各種生成性人工神經網絡之一。^[3]它是由初創公司StabilityAI、CompVis與Runway合作開發，並得到EleutherAI（英语：EleutherAI）和LAION（英语：LAION）的支持。^[4]^[5]^[6] 截至2022年10月，StabilityAI籌集了1.01億美元的資金。^[7]

Stable Diffusion的源代碼和模型權重已分别公開發布在GitHub和Hugging Face，可以在大多數配備有適度GPU的電腦硬件上運行。而以前的專有文生圖模型（如DALL-E和Midjourney）只能通過雲端運算服務訪問。^[8]^[9]

^ https://stability.ai/news/introducing-stable-diffusion-3-5.
^ Diffuse The Rest - a Hugging Face Space by huggingface. huggingface.co. [2022-09-05]. （原始内容存档于2022-09-05）（英语）.
^ 引用错误：没有为名为paper的参考文献提供内容
^ 引用错误：没有为名为stable-diffusion-launch的参考文献提供内容
^ 引用错误：没有为名为stable-diffusion-github的参考文献提供内容
^ Revolutionizing image generation by AI: Turning text into images. LMU Munich. [17 September 2022]. （原始内容存档于2022-09-17）（英语）.
^ Wiggers, Kyle. Stability AI, the startup behind Stable Diffusion, raises $101M. Techcrunch. [2022-10-17]. （原始内容存档于2022-10-17）（英语）.
^ The new killer app: Creating AI art will absolutely crush your PC. PCWorld. [2022-08-31]. （原始内容存档于2022-08-31）（英语）.
^ 引用错误：没有为名为verge的参考文献提供内容