AINews - 2025-08-19
📰 十大AI新闻要点
1. GPT-5成为ChatGPT默认模型,新增Auto/Fast/Thinking模式
OpenAI将GPT-5设为ChatGPT默认模型,为Plus/Team用户提供每周3000条消息配额,企业/教育版已上线。新增Auto/Fast/Thinking三种推理模式,保留GPT-4o等旧模型访问。
2. GPT-5推出更友好的默认人格
OpenAI为GPT-5推出”更温暖”的默认人格,增加”好问题”等社交性回应,声称不会增加谄媚行为。用户仍可通过自定义指令调整风格。
3. Imagen 4正式发布,支持2K分辨率图像生成
Google的Imagen 4全面上市,提供Ultra/Standard/Fast三档服务,生成速度比前代快10倍,开发者分享JSON提示模板实现一致性产品图生成。
4. Gemma 3 270M超小型开源模型发布
Google推出仅2.7亿参数的Gemma 3小型模型,采用非常规的嵌入层设计(170M参数),在iPad Air M3上实现约200 token/s的推理速度。
5. XLANG发布OpenCUA开源计算机使用代理框架
包含7B/32B模型和22.6k轨迹数据集,在OSWorld-Verified基准测试达到34.8%准确率,声称匹配或超越专有基线模型。
6. Meta发布DINOv3视觉模型
完全自监督训练的ViT模型,在分割、深度估计等密集视觉任务达到SOTA,引入”Gram Anchoring”技术解决长期训练中的特征退化问题。
7. NVIDIA发布Granary欧盟语音数据集和Canary-1b-v2模型
包含25种语言的语音识别和翻译能力,Parakeet-tdt-0.6b-v3在多语言ASR任务表现优异。
8. HRM架构被证明依赖外部精炼循环而非模型设计
ARC Prize和François Chollet复现发现HRM在ARC-AGI-1的表现主要来自测试时训练过程,而非模型架构本身。
9. 中国宣布高科技人才移民新政
新签证政策放宽年龄限制,面向知名大学/研究背景人才,反映中国在AI竞争中对国际人才的开放态度。
10. 律师因引用AI幻觉案例被制裁
一起法律案件显示律师因依赖AI生成的虚假判例被吊销执照,凸显AI在法律领域的应用风险。
🛠️ 十大工具产品要点
1. OpenAI开发者控制台新增”快速评估”功能
允许开发者比较GPT-5变体与自己回答的质量,内置评分器帮助优化提示工程。
2. ClipTagger-12B开源视频标注模型
基于Gemma-12B架构,在视频标注任务超越Claude 4 Sonnet,成本降低17倍,支持FP8量化和单GPU推理。
3. Cursor CLI新增MCP和Review模式
为AI辅助编程添加模型控制协议支持、代码压缩和文件引用功能,提升工具增强编码体验。
4. Guardrails推出Snowglobe代理测试平台
通过数百个角色驱动对话模拟来突破代理系统,将失败转化为训练信号,特别适用于长周期工作流加固。
5. OpenRouter报告GPT-5工具调用准确率超99.5%
在API工具调用准确率上超越Claude 4.1 Opus,Gemini 2.5 Flash以每周约500万次调用量领先。
6. Windsurf Wave 12 IDE更新
引入DeepWiki悬停解释、Vibe & Replace批量编辑、Cascade智能代理和开发容器支持等100多项改进。
7. LlamaIndex发布AI股票组合代理模板
结合CopilotKit AG-UI、Bright Data网络爬虫和LlamaCloud+Neo4j知识图谱,构建专业级金融分析工具链。
8. MLX Knife本地模型管理工具
提供OpenAI兼容的本地服务器和网页聊天界面,优化Apple Silicon芯片上的模型测试工作流。
9. Nous Research推出”思维效率”基准
测量模型完成相同任务时的token效率,发现开源模型的token消耗可达闭源模型的1.5-4倍。
10. Instagirl Wan LoRa超写实人像生成更新
v2.3版本改进文本提示遵循能力和输出美学真实感,成为特定人口统计特征生成的最佳LoRA之一。