-
Sana – 英伟达等推出的开源图像生成模型,支持生成4096×4096图像
Sana是由英伟达、麻省理工学院和清华大学等联合推出的文本到图像合成框架,能够快速生成高达4096×4096分辨率的高质量图像。Sana的核心设计包括深度压缩自编码器、线性DiT、解码器仅文本编码器和高效的训练与采样策略。这些设计使得Sana在保持图像质量的同时,显著提高了生成速度,甚至可以在笔记本电脑的GPU上部署。- 0
- 0
-
Step1X-Edit:阶跃星辰推出的开源图像编辑大模型
Step1X-Edit 是一款开源的图像编辑模型,具备语义精准解析、身份一致性保持和高精度区域级控制等核心能力,支持多种高频图像编辑任务。- 100
- 0