meituan_2025-12-24

美团 LongCat-Video-Avatar 正式发布，实现开源 SOTA 级拟真表现

2025-12-23

LongCat-Video-Avatar 是基于 LongCat-Video 基座打造的 SOTA 级虚拟人视频生成模型。其核心技术创新在于：通过 Disentangled Unconditional Guidance 实现静音段自然微动作；采用 Cross-Chunk Latent Stitching 策略在潜空间直接拼接，从根本上解决了长视频生成中的视觉质量退化与累积误差问题；并引入 Reference Skip Attention 机制，在保持身份一致性的同时避免了动作僵化。该模型原生支持 AT2V、ATI2V 等多任务，在动作拟真度、长时序稳定性和身份一致性三个维度实现显著突破，为开发者提供了高效、稳定的虚拟人生成解决方案。

阅读全文