Commit Graph

7 Commits

Author SHA1 Message Date
qhy
7dcf9e8b89 VAE优化,模型直接加载至GPU 2026-02-07 17:36:00 +08:00
qhy
aba2a90045 算子融合 2026-02-07 16:40:33 +08:00
cb334f308b DDIM loop 内小张量分配优化,attention mask 缓存到 GPU,加速30s左右 2026-01-18 22:37:55 +08:00
a90efc6718 VAE 也做 BF16
这个权重不做修改更好精度
2026-01-18 21:14:55 +08:00
3c0f409fcf 轻量投影/MLP BF16
psnr指标反而比只量化扩散主干模型要低,原因不明
2026-01-18 18:26:37 +08:00
7b499284bf 打印推理权重精度信息 2026-01-18 11:19:10 +08:00
25c6fc04db 第一次完整测例跑完 2026-01-18 00:30:10 +08:00