AINews - 2025-07-21
📰 十大AI新闻要点
1. OpenAI发布ChatGPT Agent
OpenAI推出了全新的ChatGPT Agent系统,整合了深度研究能力和计算机操作能力,可以自主完成网页浏览、终端操作、代码编写、数据分析等复杂任务。该系统采用了疑似GPT-4级别的模型(GPTNext),并设置了严格的生物滥用风险防护措施。
2. Kimi K2成为LMSys排行榜第一开源模型
Moonshot AI的Kimi K2模型在LMSys Chatbot Arena上超越Claude Opus 4成为排名第一的开源模型,在Groq硬件上速度超过200 tokens/秒,编码性能优异且成本降低90%。
3. Google DeepMind发布Veo 3视频生成模型
Google DeepMind推出Veo 3视频生成模型,现已通过Gemini API和AI Studio提供公开预览。同时Gemini 2.5 Pro在IMO 2025数学基准测试中以31.55%的得分领先。
4. Mistral为Le Chat添加深度研究模式
Mistral AI为其Le Chat产品新增深度研究模式,采用工具增强的代理系统生成结构化、有引用的研究报告,并推出专有的低延迟语音模型Voxtral。
5. xAI调查并修复Grok 4安全问题
xAI宣布已调查并修复Grok 4模型的安全问题,但其”伴侣”功能因质量低下受到批评,出现角色模型裁剪和错别字等问题。
6. Decart AI推出实时视频扩散模型MirageLSD
Decart AI发布MirageLSD模型,实现实时视频扩散,可创建视频源的替代现实、实时电影导演和基于文本提示的游戏环境风格化。
7. H-Net消除语言模型分词步骤
新型分层网络H-Net通过消除分词步骤,创建真正端到端的语言模型,可以直接处理原始字节。
8. Together AI在NVIDIA B200上实现DeepSeek R1创纪录推理速度
Together AI宣布在NVIDIA B200上为DeepSeek R1实现高达330 tokens/秒的推理速度,创下新纪录。
9. Perplexity与Airtel印度达成合作
Perplexity AI宣布与印度Airtel达成合作伙伴关系,随后其应用在印度App Store超越ChatGPT成为排名第一的应用。
10. Lovable AI初创公司融资2亿美元
AI代理初创公司Lovable在Accel领投下完成2亿美元融资,估值达到18亿美元。
🛠️ 十大工具产品要点
1. ChatGPT Agent系统提示公开
ChatGPT Agent的系统提示已在GitHub公开,展示了其任务规划和执行机制,包括网页浏览、终端操作等能力。
2. Asimov代码研究代理发布
Reflection AI推出Asimov代码研究代理,旨在解决工程师70%时间用于理解而非编写代码的问题。
3. Conductor支持多Claude Code代理并行运行
Conductor Mac应用允许用户同时运行多个Claude Code代理,提升开发效率。
4. NanoGPT训练速度新纪录
Vishal Agrawal在8xH100 GPU上以2.966分钟完成NanoGPT训练,验证损失3.28,通过优化梯度操作实现加速。
5. LlamaIndex发布生产级RAG系统指南
LlamaIndex团队发布”生产化检索指南”,详细介绍了文本提取、分块、嵌入、语义缓存搜索增强等技术。
6. Perplexity Comet浏览器新邀请批次
Perplexity开始发送新一批Comet浏览器的邀请,该浏览器整合了AI代理功能。
7. Atropos v0.3 RL环境框架发布
NousResearch推出Atropos v0.3强化学习环境框架,新增评估模式和Reward-Bench移植。
8. Notion采用Turbopuffer构建AI应用
Notion使用Turbopuffer构建最先进的AI应用,展示了向量数据库在实际产品中的应用案例。
9. PUSA V1.0开源视频生成模型
开源视频生成模型PUSA V1.0声称比WAN 2.1快5倍且质量更好,支持文本到视频、图像到视频等多种任务。
10. HiDream-E1-1图像编辑模型发布
HiDream发布E1-1图像编辑模型,能够实现高级语义编辑如主题转换、对象材质变化等复杂操作。