Stable Diffusion

Stable Diffusion
由Stable Diffusion根据文本提示“a photograph of an astronaut riding a horse”生成的图像
由Stable Diffusion根据文本提示“a photograph of an astronaut riding a horse”生成的图像
原作者Runway、CompVis、Stability AI
開發者Stability AI
首次发布2022年8月22日
当前版本
  • 3.5(2024年10月23日)[1]
編輯維基數據鏈接
源代码库 編輯維基數據鏈接
编程语言Python
操作系统任何支持CUDA內核函數的操作系統
类型文本到图像生成模型
许可协议
  • CreativeML Open RAIL-M
編輯維基數據鏈接
网站stability.ai/stable-image 编辑维基数据

Stable Diffusion是2022年發布的深度學習文本到图像生成模型。它主要用於根據文本的描述產生詳細圖像,儘管它也可以應用於其他任務,如內補繪製、外補繪製,以及在提示詞指導下產生圖生圖的转变。[2]

它是一種潛在英语Latent variable model擴散模型,由慕尼黑大學的CompVis研究團體開發的各種生成性人工神經網絡之一。[3]它是由初創公司StabilityAI、CompVis與Runway合作開發,並得到EleutherAI英语EleutherAILAION英语LAION的支持。[4][5][6] 截至2022年10月,StabilityAI籌集了1.01億美元的資金。[7]

Stable Diffusion的源代碼和模型權重已分别公開發布在GitHubHugging Face,可以在大多數配備有適度GPU的電腦硬件上運行。而以前的專有文生圖模型(如DALL-EMidjourney)只能通過雲端運算服務訪問。[8][9]

  1. ^ https://stability.ai/news/introducing-stable-diffusion-3-5.
  2. ^ Diffuse The Rest - a Hugging Face Space by huggingface. huggingface.co. [2022-09-05]. (原始内容存档于2022-09-05) (英语). 
  3. ^ 引用错误:没有为名为paper的参考文献提供内容
  4. ^ 引用错误:没有为名为stable-diffusion-launch的参考文献提供内容
  5. ^ 引用错误:没有为名为stable-diffusion-github的参考文献提供内容
  6. ^ Revolutionizing image generation by AI: Turning text into images. LMU Munich. [17 September 2022]. (原始内容存档于2022-09-17) (英语). 
  7. ^ Wiggers, Kyle. Stability AI, the startup behind Stable Diffusion, raises $101M. Techcrunch. [2022-10-17]. (原始内容存档于2022-10-17) (英语). 
  8. ^ The new killer app: Creating AI art will absolutely crush your PC. PCWorld. [2022-08-31]. (原始内容存档于2022-08-31) (英语). 
  9. ^ 引用错误:没有为名为verge的参考文献提供内容

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne