ai_news_summary_2025-08-19

AINews - 2025-08-19

原文链接

OpenAI将GPT-5设为ChatGPT默认模型，为Plus/Team用户提供每周3000条消息配额，企业/教育版已上线。新增Auto/Fast/Thinking三种推理模式，保留GPT-4o等旧模型访问。

OpenAI为GPT-5推出”更温暖”的默认人格，增加”好问题”等社交性回应，声称不会增加谄媚行为。用户仍可通过自定义指令调整风格。

Google的Imagen 4全面上市，提供Ultra/Standard/Fast三档服务，生成速度比前代快10倍，开发者分享JSON提示模板实现一致性产品图生成。

Google推出仅2.7亿参数的Gemma 3小型模型，采用非常规的嵌入层设计（170M参数），在iPad Air M3上实现约200 token/s的推理速度。

包含7B/32B模型和22.6k轨迹数据集，在OSWorld-Verified基准测试达到34.8%准确率，声称匹配或超越专有基线模型。

完全自监督训练的ViT模型，在分割、深度估计等密集视觉任务达到SOTA，引入”Gram Anchoring”技术解决长期训练中的特征退化问题。

包含25种语言的语音识别和翻译能力，Parakeet-tdt-0.6b-v3在多语言ASR任务表现优异。

ARC Prize和François Chollet复现发现HRM在ARC-AGI-1的表现主要来自测试时训练过程，而非模型架构本身。

新签证政策放宽年龄限制，面向知名大学/研究背景人才，反映中国在AI竞争中对国际人才的开放态度。

一起法律案件显示律师因依赖AI生成的虚假判例被吊销执照，凸显AI在法律领域的应用风险。

允许开发者比较GPT-5变体与自己回答的质量，内置评分器帮助优化提示工程。

基于Gemma-12B架构，在视频标注任务超越Claude 4 Sonnet，成本降低17倍，支持FP8量化和单GPU推理。

为AI辅助编程添加模型控制协议支持、代码压缩和文件引用功能，提升工具增强编码体验。

通过数百个角色驱动对话模拟来突破代理系统，将失败转化为训练信号，特别适用于长周期工作流加固。

在API工具调用准确率上超越Claude 4.1 Opus，Gemini 2.5 Flash以每周约500万次调用量领先。

引入DeepWiki悬停解释、Vibe & Replace批量编辑、Cascade智能代理和开发容器支持等100多项改进。

结合CopilotKit AG-UI、Bright Data网络爬虫和LlamaCloud+Neo4j知识图谱，构建专业级金融分析工具链。

提供OpenAI兼容的本地服务器和网页聊天界面，优化Apple Silicon芯片上的模型测试工作流。

测量模型完成相同任务时的token效率，发现开源模型的token消耗可达闭源模型的1.5-4倍。

v2.3版本改进文本提示遵循能力和输出美学真实感，成为特定人口统计特征生成的最佳LoRA之一。