Skip to content

Stable Diffusion 3 开源了:本地跑图的新选择

发布时间:2024-06-15 08:00
最后编辑:2024-06-15 08:00
全文大约 0 字(读完需 1 分钟)

等了好几个月,Stable Diffusion 3 Medium 终于开源了。

虽然不是最强的 SD3 Large,但 Medium 版本也带来了很多惊喜。

核心升级

相比 SDXL,SD3 的改进主要在:

  1. 文字渲染:终于能在图片里画出正确的文字了
  2. 图像质量:细节更丰富,手指不会画错
  3. 架构升级:使用 DiT 架构,生成更稳定

配置要求

SD3 Medium 比 SDXL 更轻量:

  • 显存需求:8GB 可跑,12GB 更流畅
  • 生成速度:3060 显卡约 15 秒一张(1024x1024)
  • 模型大小:约 4GB

比 SDXL 省资源,效果还更好。

本地部署

用 ComfyUI 最简单:

  1. 下载 SD3 Medium safetensors 文件
  2. 放到 ComfyUI/models/checkpoints/
  3. 加载官方提供的工作流
  4. 开画

或者用命令行:

bash
pip install diffusers
python -c "from diffusers import StableDiffusion3Pipeline; ..."

实际效果

测试了几个常见场景:

  • 人物:面部细节好,手指正常了
  • 风景:光影层次丰富
  • 文字:英文基本正确,中文还是不行
  • 二次元:需要配合 LoRA,原生风格偏写实

最惊喜的是文字渲染,以前 SD 画 logo 全靠玄学,现在终于可控了。

和 MidJourney 对比

MJ 还是更傻瓜式,出图即用。

SD3 需要折腾,但胜在免费、本地、无限制。

对于学预算有限又想玩 AI 绘画的同学,SD3 是最佳选择。

总结

SD3 开源是 AI 绘画界的大事。

配合 ComfyUI 的工作流,普通笔记本就能实现商业级出图。这在一年前要花大价钱。

Built with ❤️ using VitePress v2 & Vue & Vite