Files
olivame 57ba85d147 KV 融合实现完成。改动总结: 速度微弱提升psnr略微上升
attention.py — 3处改动:
  1. __init__ 添加 _kv_fused = False 标志
  2.新增 fuse_kv() 方法:将 to_k + to_v → to_kv,同时处理 _ip/_as/_aa 辅助 KV 对
  2. bmm_forward 两个分支加_kv_fused 判断,用to_kv().chunk(2, dim=-1) 替代分别调用
2026-02-10 18:15:52 +00:00
..
2025-09-12 21:53:41 +08:00
2025-09-12 21:53:41 +08:00
2025-09-12 21:53:41 +08:00
2025-09-12 21:53:41 +08:00