![]() 由Stable Diffusion根据文本提示“a photograph of an astronaut riding a horse”生成的图像 | |
原作者 | Runway、CompVis、Stability AI |
---|---|
開發者 | Stability AI |
首次发布 | 2022年8月22日 |
当前版本 |
|
源代码库 | |
编程语言 | Python |
操作系统 | 任何支持CUDA內核函數的操作系統 |
类型 | 文本到图像生成模型 |
许可协议 |
|
网站 | stability![]() |
Stable Diffusion是2022年發布的深度學習文本到图像生成模型。它主要用於根據文本的描述產生詳細圖像,儘管它也可以應用於其他任務,如內補繪製、外補繪製,以及在提示詞指導下產生圖生圖的转变。[2]
它是一種潛在擴散模型,由慕尼黑大學的CompVis研究團體開發的各種生成性人工神經網絡之一。[3]它是由初創公司StabilityAI、CompVis與Runway合作開發,並得到EleutherAI和LAION的支持。[4][5][6] 截至2022年10月,StabilityAI籌集了1.01億美元的資金。[7]
Stable Diffusion的源代碼和模型權重已分别公開發布在GitHub和Hugging Face,可以在大多數配備有適度GPU的電腦硬件上運行。而以前的專有文生圖模型(如DALL-E和Midjourney)只能通過雲端運算服務訪問。[8][9]
paper
的参考文献提供内容stable-diffusion-launch
的参考文献提供内容stable-diffusion-github
的参考文献提供内容verge
的参考文献提供内容