ai_news_summary_2025-07-21

AINews - 2025-07-21

原文链接

📰 十大AI新闻要点

1. OpenAI发布ChatGPT Agent

OpenAI推出了全新的ChatGPT Agent系统,整合了深度研究能力和计算机操作能力,可以自主完成网页浏览、终端操作、代码编写、数据分析等复杂任务。该系统采用了疑似GPT-4级别的模型(GPTNext),并设置了严格的生物滥用风险防护措施。


2. Kimi K2成为LMSys排行榜第一开源模型

Moonshot AI的Kimi K2模型在LMSys Chatbot Arena上超越Claude Opus 4成为排名第一的开源模型,在Groq硬件上速度超过200 tokens/秒,编码性能优异且成本降低90%。


3. Google DeepMind发布Veo 3视频生成模型

Google DeepMind推出Veo 3视频生成模型,现已通过Gemini API和AI Studio提供公开预览。同时Gemini 2.5 Pro在IMO 2025数学基准测试中以31.55%的得分领先。


4. Mistral为Le Chat添加深度研究模式

Mistral AI为其Le Chat产品新增深度研究模式,采用工具增强的代理系统生成结构化、有引用的研究报告,并推出专有的低延迟语音模型Voxtral。


5. xAI调查并修复Grok 4安全问题

xAI宣布已调查并修复Grok 4模型的安全问题,但其”伴侣”功能因质量低下受到批评,出现角色模型裁剪和错别字等问题。


6. Decart AI推出实时视频扩散模型MirageLSD

Decart AI发布MirageLSD模型,实现实时视频扩散,可创建视频源的替代现实、实时电影导演和基于文本提示的游戏环境风格化。


7. H-Net消除语言模型分词步骤

新型分层网络H-Net通过消除分词步骤,创建真正端到端的语言模型,可以直接处理原始字节。


8. Together AI在NVIDIA B200上实现DeepSeek R1创纪录推理速度

Together AI宣布在NVIDIA B200上为DeepSeek R1实现高达330 tokens/秒的推理速度,创下新纪录。


9. Perplexity与Airtel印度达成合作

Perplexity AI宣布与印度Airtel达成合作伙伴关系,随后其应用在印度App Store超越ChatGPT成为排名第一的应用。


10. Lovable AI初创公司融资2亿美元

AI代理初创公司Lovable在Accel领投下完成2亿美元融资,估值达到18亿美元。


🛠️ 十大工具产品要点

1. ChatGPT Agent系统提示公开

ChatGPT Agent的系统提示已在GitHub公开,展示了其任务规划和执行机制,包括网页浏览、终端操作等能力。


2. Asimov代码研究代理发布

Reflection AI推出Asimov代码研究代理,旨在解决工程师70%时间用于理解而非编写代码的问题。


3. Conductor支持多Claude Code代理并行运行

Conductor Mac应用允许用户同时运行多个Claude Code代理,提升开发效率。


4. NanoGPT训练速度新纪录

Vishal Agrawal在8xH100 GPU上以2.966分钟完成NanoGPT训练,验证损失3.28,通过优化梯度操作实现加速。


5. LlamaIndex发布生产级RAG系统指南

LlamaIndex团队发布”生产化检索指南”,详细介绍了文本提取、分块、嵌入、语义缓存搜索增强等技术。


6. Perplexity Comet浏览器新邀请批次

Perplexity开始发送新一批Comet浏览器的邀请,该浏览器整合了AI代理功能。


7. Atropos v0.3 RL环境框架发布

NousResearch推出Atropos v0.3强化学习环境框架,新增评估模式和Reward-Bench移植。


8. Notion采用Turbopuffer构建AI应用

Notion使用Turbopuffer构建最先进的AI应用,展示了向量数据库在实际产品中的应用案例。


9. PUSA V1.0开源视频生成模型

开源视频生成模型PUSA V1.0声称比WAN 2.1快5倍且质量更好,支持文本到视频、图像到视频等多种任务。


10. HiDream-E1-1图像编辑模型发布

HiDream发布E1-1图像编辑模型,能够实现高级语义编辑如主题转换、对象材质变化等复杂操作。