ai_news_summary_2025-10-09

AINews - 2025-10-09

原文链接

📰 十大AI新闻要点

1. OpenAI DevDay发布多项重磅产品

OpenAI在开发者大会上发布了包括Apps SDK、AgentKit、Codex GA、GPT-5 Pro和Sora 2 API等多项重要产品,标志着ChatGPT向应用平台转型的重大战略转变


2. GPT-5 Pro正式发布

OpenAI发布GPT-5 Pro模型,定价为输入15美元/输出120美元每百万tokens,针对更复杂的推理任务进行了优化


3. Sora 2和Sora 2 Pro API开放

Sora 2和Sora 2 Pro视频生成模型正式通过API提供,支持声音、混音和时长控制,定价分别为0.10美元/秒和0.30-0.50美元/秒


4. OpenAI与AMD达成多年合作协议

OpenAI与AMD宣布多年计划部署6GW的Instinct GPU,AMD向OpenAI发行最多1.6亿股认股权证,标志着AI计算基础设施的多元化发展


5. 中国模型Qwen3-VL-30B-A3B发布

阿里巴巴发布Qwen3-VL-30B-A3B模型,采用MoE架构约30亿激活参数,支持256k-1M上下文长度,32种语言,目标对标GPT-5-Mini/Claude Sonnet


6. GLM-4.6在LMArena排名第一

智谱AI的GLM-4.6在LMArena排行榜中位列开源模型第一、总体排名第四,显示中国模型在性能上的显著进步


7. Tesla Optimus展示Kung Fu学习能力

Tesla Optimus人形机器人展示学习功夫的能力,公司领导层暗示将统一自动驾驶和人形机器人技术栈


8. Figure机器人在宝马生产线运行5个月

Figure人形机器人在宝马X3车身车间生产线连续运行5个月,每天工作10小时,被认为是全球首个在汽车制造中持续部署的人形机器人


9. Anthropic开源Petri对齐审计工具包

Anthropic开源Petri工具包,用于场景驱动的对齐审计,已在内部用于4.5版本的对齐测试,现被AISec研究所用于外部评估


10. Google DeepMind CodeMender贡献72个安全修复

Google DeepMind的CodeMender AI代理已向上游主要开源项目提交72个被接受的安全修复补丁,展示了AI在代码安全领域的实际应用价值


🛠️ 十大工具产品要点

1. OpenAI Apps SDK发布

基于MCP构建的Apps SDK允许合作伙伴在ChatGPT中嵌入完整的交互式应用,支持自定义UI、操作和即将推出的货币化功能,早期合作伙伴包括Canva、Figma等


2. AgentKit端到端代理栈

OpenAI推出完整的代理技术栈,包括可视化Agent Builder、ChatKit UI、Guardrails、Evals和Connectors,可在8分钟内构建生产级代理


3. Codex正式可用并发布SDK

Codex正式发布GA版本,提供SDK、Slack集成和企业控制/分析功能,支持代码审查和CLI/IDE工作流


4. gpt-realtime-mini成本降低70%

新的gpt-realtime-mini模型提供语音到语音功能,成本比原版gpt-realtime降低约70%


5. gpt-image-1-mini成本降低80%

GPT图像生成模型mini版本发布,成本比原版降低80%,大幅降低了图像生成的API成本


6. LM Studio v0.3.29支持OpenAI兼容API

LM Studio新增OpenAI /v1/responses兼容性API,允许应用直接与本地模型集成,同时提供CLI工具lms ls –variants列出本地模型变体


7. NVIDIA TensorRT-LLM v1.0发布

NVIDIA TensorRT-LLM达到v1.0版本,提供PyTorch原生核心、CUDA Graphs、推测解码和GB200支持,现服务于Llama3、DeepSeek V3/R1等模型


8. vLLM支持PipelineRL实时权重更新

vLLM继续支持前沿RL循环,包括PipelineRL的实时权重更新和陈旧KV缓存混合功能


9. DSPy-ReAct-Machina多轮代理模块发布

社区发布DSPy-ReAct-Machina模块,支持多轮ReAct对话,使用单个增长上下文缓冲区,减少工具调用抖动并稳定长计划


10. Neosantara免费LLM网关平台

Neosantara AI推出免费LLM网关平台,集成DSPy,新用户每月获得10k消费tokens,支持快速应用搭建而不锁定单一提供商