ai_news_summary_2025-08-10

AINews - 2025-08-10

原文链接

OpenAI在GPT-5发布时意外宣布立即弃用GPT-4o，这一决定引发强烈反对后被撤销。用户批评新模型取消了手动选择功能，且Plus用户的使用限制大幅减少。

GPT-5在FrontierMath等学术基准测试中创下新纪录，但在实际使用中因路由系统不稳定导致性能波动。OpenAI承诺将修复自动切换器并提高模型透明度。

微软宣布所有Copilot用户现已使用GPT-5，OpenAI报告API流量在24小时内翻倍，峰值吞吐量达到每分钟20亿token。

阿里云的Qwen3-30B和Qwen3-235B模型通过Dual Chunk Attention和MInference技术支持100万token上下文，在长文本处理速度上提升3倍。

Google在短时间内发布了Genie-3世界模拟器、Gemini 2.5 Pro Deep Think等多款产品，其中NotebookLM的”视频概述”功能获得好评。

社区质疑OpenAI故意发布性能较弱的开源模型GPT-OSS来应对缺乏开源承诺的批评，尽管该模型在安全过滤任务中表现优异。

llama.cpp通过支持attention sinks技术，在GPT-OSS模型上实现高达3倍的提示处理速度提升，使大模型在消费级硬件上运行更加可行。

Anthropic为Claude Code添加了长期运行的后台任务支持和可定制的终端状态行，提升了编程代理的工作流体验。

业界逐渐从单一基准测试转向关注失败模式、工具调用次数和经济指标等动态评估方法，对LLM作为评判者的可靠性持怀疑态度。

Google Research的实验显示，通过专家标签的主动学习可将微调数据从10万例减少到不足500例，同时保持或提升模型质量。

GPT-5引入按价格层级区分的”优先处理”选项，使用”service_tier: priority”等参数可将P50 TTFT降至约750ms。

阿里云为Qwen Code CLI用户提供每日2000次免费运行额度，支持”氛围编程”体验。

Cursor/Codex CLI现已支持GPT-5，为ChatGPT计划用户提供慷慨但动态调整的速率限制，欧盟地区上线略有延迟。

新增支持正则表达式/语法约束的工具参数，并与LangGraph和LangChain代理集成。

支持N维并行(轻松堆叠DP/TP/PP)和清晰配置，简化大规模模型训练部署。

新增多节点ND并行训练、FP8支持、GPT-OSS微调和TiledMLP的FSDP支持。

社区探讨无需自定义内核实现块稀疏与任意注意力掩码的技术方案。

OpenAI的Harmony数据集格式现已在Hugging Face Datasets上得到支持。

腾讯总部举办260+开发者会议，中国主要实验室分享采用vLLM进行规模部署的经验。

详细工作流展示如何使用RTX 4090(64GB RAM)运行Wan2.2模型，结合FramePack Studio和DaVinci Resolve进行后期处理。