美团 LongCat-Video-Avatar 正式发布,实现开源 SOTA 级拟真表现
2025-12-23
LongCat-Video-Avatar 是基于 LongCat-Video 基座打造的 SOTA 级虚拟人视频生成模型。其核心技术创新在于:通过 Disentangled Unconditional Guidance 实现静音段自然微动作;采用 Cross-Chunk Latent Stitching 策略在潜空间直接拼接,从根本上解决了长视频生成中的视觉质量退化与累积误差问题;并引入 Reference Skip Attention 机制,在保持身份一致性的同时避免了动作僵化。该模型原生支持 AT2V、ATI2V 等多任务,在动作拟真度、长时序稳定性和身份一致性三个维度实现显著突破,为开发者提供了高效、稳定的虚拟人生成解决方案。