AINews - 2025-07-24
📰 十大AI新闻要点
1. Kimi K2 技术报告发布,声称在代理任务上达到SOTA
Moonshot AI发布了Kimi K2的技术报告,这是一个1万亿参数的超稀疏混合专家(MoE)模型。报告详细介绍了用于稳定训练的MuonClip优化器、使用超过20,000个工具的大规模代理数据合成管道,以及联合RL对齐方法。该模型被描述为类似DeepSeekV3风格的MoE,但具有更高的稀疏性,并且是开源的。
2. Qwen3-235B-A22B挑战Kimi K2,夺回基准榜首
阿里巴巴更新了Qwen3模型,Qwen3-235B-A22B变体重新夺回基准榜首。该模型比Kimi 2小4.25倍(235B vs 1T参数),但具有更多层并使用GQA而非MLA。据报道,它在GPQA、AIME和LiveCodeBench等基准上击败了Kimi-K2、Claude-4 Opus和DeepSeek V3。
3. Qwen3-Coder-480B-A35B发布,专为高级代码生成设计
阿里巴巴发布了Qwen3-Coder,这是一个总参数480B、活跃参数35B的MoE模型,专为编码和代理任务设计。该模型具有100万token的上下文窗口,在SWE-bench上表现出色。架构上比基础Qwen3更宽更浅,有62层、6144隐藏维度和160个专家。
4. Google推出Gemini 2.5 Flash-Lite
Google宣布稳定发布Gemini 2.5 Flash-Lite,这是其2.5系列中最具成本效益和最快的模型。Google DeepMind表示它比2.0 Flash模型更快、更具成本效益,同时在编码、数学和多模态理解方面表现更好。
5. Google DeepMind的Gemini正式获得IMO金牌
Demis Hassabis宣布,Gemini Deep Think的高级版本在国际数学奥林匹克(IMO)中获得了金牌级别的分数(35/42),这是AI模型的首次。
6. OpenAI宣布与Oracle合作建设”Stargate”5GW数据中心
OpenAI宣布正在与Oracle合作开发额外的4.5千兆瓦”Stargate”数据中心容量,使总容量超过5GW。位于德克萨斯州Abilene的Stargate I站点已开始上线。
7. Perplexity Comet浏览器获得关注
Perplexity AI的新浏览器Comet的等待名单自推出以来翻了一番。早期用户反馈表明它使传统聊天界面”感觉过时”。CEO关于是否想要一个代理来处理会议的推文获得了超过3,300次印象,显示出对其代理能力的强烈兴趣。
8. LangChain 1.0即将发布
Harrison Chase宣布团队正在努力推出langchain 1.0,将专注于成为构建LLM应用的最简单起点,提供改进的文档和基于LangGraph构建的通用代理架构。LangGraph被描述为较低级别的”代理运行时”,而LangChain将提供更高级别的抽象。
9. xAI的Colossus超级集群扩展
Elon Musk透露,Colossus 2将托管超过550,000个NVIDIA GB200和GB300 GPU。Colossus 1目前运行230,000个GPU(包括30,000个GB200)用于xAI的Grok模型训练。Musk声称,根据Jensen Huang的说法,xAI的速度”无与伦比”。
10. AMD推出Strix Halo”Ryzen AI MAX”APU
AMD的Strix Halo”Ryzen AI MAX”APU通过新的MoDT Mini-ITX主板提供给DIY PC制造商,支持高达128GB的LPDDR5X内存。这些主板针对紧凑型AI/ML和边缘计算应用,但缺乏标准PCIe扩展插槽。
🛠️ 十大工具产品要点
1. Qwen3-Coder-480B-A35B-Instruct
阿里巴巴发布的480B参数MoE模型,专为编码设计,具有100万token上下文窗口,已在Hyperbolic AI平台上线。
2. MegaTTS 3语音克隆
ByteDance的MegaTTS 3的WavVAE编码器已发布,支持多样化的口音和音色,在Hugging Face上提供模型和演示。
3. vLLM与Hugging Face Transformers集成
vLLM项目宣布支持开箱即用的视觉语言模型与Transformers集成,简化了多模态模型的部署和推理。
4. LlamaIndex开源RFP响应代理
LlamaIndex构建了一个完全开源的代理,用于自动化请求提案(RFP)响应,处理文档提取、分析和报告生成。
5. Perplexity Comet浏览器
Perplexity AI的新浏览器,具有代理能力,等待名单自推出以来翻了一番,早期用户反馈积极。
6. LangChain 1.0
即将发布的LangChain 1.0将专注于成为构建LLM应用的最简单起点,提供改进的文档和基于LangGraph构建的通用代理架构。
7. Anthropic增强移动端Artifacts
Anthropic推出了与移动端Artifacts互动的新方式,允许用户创建交互式工具、浏览画廊并直接从手机分享作品。
8. OpenAI临床副驾驶在肯尼亚
OpenAI与肯尼亚的PendaHealth合作,研究了一个OpenAI驱动的临床副驾驶在40,000次患者就诊中的表现。
9. ik_llama.cpp仓库恢复
提供Llama模型C++推理代码的ik_llama.cpp仓库在GitHub上恢复,强调了定期备份关键仓库的重要性。
10. AMD Strix Halo”Ryzen AI MAX”APU
AMD的Strix Halo”Ryzen AI MAX”APU通过新的MoDT Mini-ITX主板提供给DIY PC制造商,支持高达128GB的LPDDR5X内存,针对紧凑型AI/ML和边缘计算应用。