Causal Forcing:自回归扩散蒸馏与高质量实时交互视频生成
关键词:自回归扩散、因果注意力、ODE蒸馏、分布匹配蒸馏、流映射学习
一、问题背景:双向到自回归的架构鸿沟与实时视频生成的需求
1.1 实时交互视频生成的核心挑战当前视频扩散模型面临的根本性矛盾在于生成质量与实时性之间的权衡:
模型类型
注意力机制
生成特性
主要优势
核心局限
双向模型(Bidirectional)

