meituan_2026-01-27

美团 EvoCUA 刷新开源 SOTA,会用电脑还会持续进化的智能体!

2026-01-26

美团EvoCUA模型针对GUI智能体训练中高质量数据稀缺和交互反馈缺失的挑战,提出了创新的“经验进化学习”范式。其核心是通过可验证数据合成引擎生成高质量、可执行的任务,并构建高并发交互沙盒支持大规模环境探索。模型采用渐进式训练策略(冷启动、拒绝采样微调、关键分岔点强化学习),显著提升了长链路操作的鲁棒性。该方案在OSWorld基准上以56.7%的成功率刷新开源SOTA,验证了进化范式在提升计算机操作智能体能力方面的有效性和可扩展性。

阅读全文