meituan_2025-11-04

LongCat-Flash-Omni正式发布并开源:开启全模态实时交互时代

2025-11-03

美团开源LongCat-Flash-Omni全模态大模型,采用ScMoE架构与端到端设计,集成轻量级多模态编解码器,在5600亿参数规模下实现毫秒级实时音视频交互。通过渐进式多模融合训练策略,模型在文本、图像、音频、视频任务中均达开源SOTA,首次实现全模态能力对标闭源模型,为多模态应用提供高性能、低延迟的解决方案。

阅读全文