ai_news_summary_2025-09-25

AINews - 2025-09-25

原文链接

📰 十大AI新闻要点

1. 阿里云栖大会发布通义千问全系列模型更新

阿里云在年度云栖大会上发布了通义千问系列重大更新,包括Qwen3-Max(1T参数)、Qwen3-Omni、Qwen3-VL等核心模型,以及Qwen3Guard、Qwen3-LiveTranslate等配套工具


2. OpenAI宣布与NVIDIA深度合作并加速Stargate建设

OpenAI宣布与NVIDIA达成近十年合作,加速建设五个新的Stargate站点,目标实现每周1GW的AI基础设施产能,标志着AI计算建设进入新阶段


3. 阿里CEO吴泳铭公布520亿美元AI发展路线图

阿里巴巴CEO吴泳铭在云栖大会提出AI发展三阶段理论:智能涌现(学习人类)、自主行动(辅助人类)、自我迭代(超越人类),并宣布520亿美元投资计划


4. OpenAI发布GPT-5-Codex专为智能体编码优化

OpenAI推出GPT-5-Codex,通过Responses API专门为智能体编码工作流优化,支持长任务处理和自适应推理,已集成到VS Code、GitHub Copilot等主流开发工具


5. Meta发布Gaia2和Agents Research Environments

Meta推出Gaia2基准测试和开源Agents Research Environments(ARE),用于在动态真实世界场景中评估AI智能体,取代传统的静态谜题测试


6. Chrome DevTools支持MCP协议实现智能体网页调试

Chrome DevTools集成Model Context Protocol(MCP),允许AI智能体程序化运行性能追踪、检查DOM和调试网页,提升智能体开发效率


7. 昆仑万维Kling 2.5 Turbo视频模型实现商业化部署

Kling 2.5 Turbo在FAL平台提供Day-0访问,显著改善动态效果、风格适应和情感表达,Higgsfield宣布在其产品内提供”无限”使用权限


8. Luma发布Ray 3支持16位HDR视频生成

Luma Ray 3成为首个支持16位HDR的视频生成模型,采用链式思维迭代优化技术,目前仅在Dream Machine中可用


9. vLLM实现全CUDA-graphs默认支持大幅提升推理速度

vLLM默认启用全CUDA-graphs支持,在Qwen3-30B-A3B-FP8模型上实现47%的速度提升,显著优化大规模模型推理效率


10. LIMI研究显示数据质量比模型规模更重要

LIMI研究仅用78个精选演示就在AgencyBench上达到73.5%性能,提出”智能体效率原则”,强调战略性数据策划比单纯扩大模型规模更有效


🛠️ 十大工具产品要点

1. Qwen3-Max成为通义千问最强模型

Qwen3-Max作为1T参数旗舰模型,在SWE-Bench、Tau2-Bench等基准测试中接近SOTA水平,Thinking变体在工具增强下接近完美表现


2. Qwen3-Omni实现端到端多模态任意转换

30B MoE模型支持图像/文本/音频/视频输入和文本/语音输出,覆盖119种语言文本和19种语言语音,在多模态基准测试中超越Gemini 2.5 Pro和GPT-4o


3. Qwen3-VL-235B-A22B具备强大视觉编程能力

支持256K上下文可扩展至~1M,具备截图转HTML/CSS/JS的视觉编码能力,32语言OCR和2D/3D空间推理,在OSWorld基准测试中达到SOTA


4. Qwen3-Coder-Plus提升终端任务和代码生成能力

在SWE-Bench上达到69.6分,支持多模态编码和子智能体协作,通过阿里云Model Studio和开源产品Qwen Code提供


5. Qwen3Guard提供多语言内容审核解决方案

0.6B/4B/8B三种规模,支持119种语言,提供流式处理和全上下文两种变体,三级严重程度分类,专为RL奖励建模设计


6. Qwen3-LiveTranslate-Flash实现实时多模态翻译

~3秒延迟的实时多模态口译,支持唇语/手势/屏幕文本识别,抗噪声能力强,理解18种语言+6种方言,输出10种语言语音


7. Qwen-Image-Edit-2509推出GGUF量化版本

QuantStack发布GGUF量化版本,支持本地推理,ComfyUI集成需要更新并使用TextEncodeQwenImageEditPlus文本编码器节点


8. OpenRouter全面支持GPT-5-Codex API

OpenRouter提供GPT-5-Codex专用API,优化智能体编码工作流,支持100+语言,动态调整推理努力程度适应不同复杂度任务


9. Windsurf免费提供GPT-5-Codex集成

Windsurf为付费用户限时免费提供GPT-5-Codex,免费用户享受0.5倍积分优惠,显著提升长任务和设计相关编码效率


10. aider编辑器智能体支持Responses API

aider通过PR #4528实现原生Responses API支持,专门适配GPT-5-Codex的v1/responses端点,确保编码智能体工作流稳定性