ai_news_summary_2025-10-30

AINews - 2025-10-30

原文链接

OpenAI宣布完成资本重组和企业结构重组，非营利部分成为OpenAI基金会，营利部分成为公共利益公司(PBC)。基金会持有约1300亿美元股权，并拥有特殊投票权任命/替换PBC董事会。微软放弃独家权以换取OpenAI 2500亿美元的Azure支出承诺，为”可能”的IPO扫清障碍。

OpenAI在直播中宣布今年30GW计算交易总额达1.4万亿美元（每GW 470亿美元），目标最终达到每周建设1GW、每GW 200亿美元（约每年1万亿美元计算资本支出）。到2033年，OpenAI将管理价值3-4万亿美元的基础设施。

OpenAI宣布减少对第一方应用的重视，更加强调平台方法，引用比尔·盖茨线”平台价值更多由在平台上构建的人创造”。这标志着公司战略从应用导向转向平台导向的重要转变。

GitHub宣布Agent HQ协调”任何代理、任何时间、任何地方”，将Claude、Devin等原生协作者集成到GitHub工作流中。VS Code Insiders现在提供Agent Sessions视图，支持OpenAI Codex和Copilot CLI。

Cartesia筹集1亿美元，推出基于状态空间模型的实时语音模型Sonic-3，具有90ms模型延迟（190ms端到端），支持42种语言，具有自然情感范围和笑声功能。

Anthropic发布了Opus 4破坏风险评估报告及METR外部审查，提高了风险透明度。审查人员同意风险评估，并呼吁对多样化威胁模型进行更广泛的第三方审查。

vLLM睡眠模式为多模型服务提供零重新加载模型切换，比冷启动快18-200倍，首令牌速度快61-88%。支持L1（权重卸载到CPU）和L2（丢弃权重）两种级别。

名为THOR的35公斤人形机器人展示了拉动1400公斤汽车的能力，突显了人形机器人控制和效率的显著进步。机器人能够微调姿势以实现最佳拉动效率。

Matt Rosenberg使用Claude AI通过分析针对Medicare报销规则的收费，将医院账单从19.5万美元谈判至3.3万美元。AI识别出显著超额收费和不正确的编码实践。

OpenAI披露每周有超过100万用户在ChatGPT上讨论自杀内容，同时有指控称公司在用户自杀前削弱了安全协议。Adam Raine的家人声称他与ChatGPT的互动显著增加，自残内容从消息的1.6%上升到17%。

LangChain Deep Agents 0.2引入”后端”抽象，可将代理文件系统交换为本地FS、DB或远程VM。专注于长时间运行、高性能代理，具有上下文压缩、文件系统卸载和子代理隔离功能。

Liquid AI发布350M多语言后期交互检索器LFM2-ColBERT-350M，具有令牌级精度、预计算文档嵌入和强大的跨语言性能。声称是500M以下最佳跨语言检索器，编码速度超过1000文档/秒。

IBM发布Apache-2.0许可的Granite 4 Nano小型模型，1B变体在数学/编码方面据报道优于Qwen3-1.7B，提供更高效的推理选项。

NVIDIA发布12B参数视觉语言模型Nemotron Nano 2 VL，用于文档/视频理解（每个提示4张图像或1个视频），在Replicate、Baseten、Nebius等平台部署，附带800万样本CC-BY-4.0数据集。

MiniMax M2开源230B参数MoE模型，在AgentArena上排名前5，声称具有Claude Sonnet级别的编码能力，价格约为8%，推理速度快2倍。支持OpenRouter、Roo Code、Ollama Cloud。

OpenRouter推出高精度工具调用端点Exacto，在Kimi K2上质量提升约30%，支持五个开源模型。用户现在可以每天、每周或每月重置API密钥限制。

OpenFold3作为开源基础模型发布，用于蛋白质/核酸/小分子的3D结构预测，推动生物科学研究的开放访问。

LeRobot v0.4发布可流式传输的数据集格式，支持LIBERO/Meta-World模拟，提供数据处理器、多GPU训练、硬件插件和SOTA策略，附带开放课程。

Google推出Gemini for Home早期访问（美国），将经典”Hey Google”请求与Gemini Live对话会话结合，在扬声器和显示器上提供增强的语音助手体验。

Google的Veo 3.1更新强调更丰富的音频、叙事控制和真实感，为AI视频生成提供更专业的电影制作能力。