AINews - 2025-07-18
📰 十大AI新闻要点
1. Mistral发布Voxtral语音识别模型
Mistral宣布推出Voxtral,号称是”世界最佳[且开源]的语音识别模型”。用户可通过API、Le Chat或Hugging Face下载使用。
2. Kimi K2开放模型挑战专有模型
Moonshot AI的万亿参数Mixture-of-Experts模型Kimi K2在Groq上达到200 tokens/秒的速度,SWE-Bench Verified基准测试得分65.4%,超越GPT-4.1。
3. Google推出Mixture-of-Recursions架构
Google DeepMind的新架构Mixture-of-Recursions(MoR)有望实现2倍推理速度并减少50%参数,但被质疑可能过度工程化。
4. Jason Wei提出验证者定律
Jason Wei提出”验证者定律”,认为训练AI的难易程度与任务的可验证性成正比,验证解决方案比找到解决方案更容易是AI进步的关键。
5. OpenAI呼吁加强思维链研究
OpenAI发布立场文件,呼吁研究如何使模型推理过程(思维链)更可解释和可靠,表示这是他们的重点投资领域。
6. Meta挖角OpenAI核心研究人员
Meta从OpenAI挖走Jason Wei(扩展定律论文合著者)和Hyung Won Chung(GPT-4核心架构师),加强其在扩展定律和高级LLM架构方面的能力。
7. Runway推出Act Two动作捕捉模型
Runway的新模型Act Two可将视频表演转换为富有表现力的角色动作,演示包括将人变成跳舞的古希腊雕像和指环王中的兽人。
8. xAI发布”Waifu工程师”高薪职位
xAI发布”Fullstack Engineer - Waifus”职位,年薪高达44万美元,显示AI伴侣和角色机器人在消费级应用中的重要性提升。
9. 美国判例法99%开源
99%的美国判例法已在Hugging Face上开源,这些数据通常被法律科技公司高价出售。
10. AMD发布Radeon AI PRO R9700 GPU
AMD推出32GB显存的Radeon AI PRO R9700 GPU,售价约1250美元,是NVIDIA RTX PRO Blackwell(24GB显存)价格的一半。
🛠️ 十大工具产品要点
1. Kimi K2 Instruct GGUF本地运行版本
Kimi K2现在可通过GGUF格式在本地运行,为开发者提供高性能、低成本的替代方案。
2. Hermes 3数据集开源
Nous Research开源包含100万样本的Hermes 3数据集,用于创建Llama-3系列上的SOTA模型。
3. LangChain发布Open Deep Research Agent
基于LangGraph构建的研究代理,采用监督架构协调子代理完成复杂研究任务。
4. Reflection AI推出Asimov代码理解工具
帮助工程师理解代码库的新工具,解决工程师70%时间花在理解而非编写代码上的问题。
5. LlamaIndex与UiPath深度集成
开发者可在UiPath企业自动化平台中使用LlamaIndex的工作流工具构建自定义代理。
6. LTXV解锁60秒AI视频生成
Lightricks的开源视频生成模型支持原生长视频(30-60+秒)生成,可在消费级GPU上运行。
7. Claude Code模块化命令系统
开源模块化命令系统替代庞大的CLAUDE.md文件,可减少50-80%的token使用量。
8. Muon优化器将进入PyTorch核心库
用于训练Kimi K2的Muon优化器因其高效性将被纳入PyTorch核心库。
9. Lightx2v发布I2V/T2V LoRA模型
新发布的图像到视频和文本到视频LoRA模型改进了运动一致性和提示遵循能力。
10. ETHOS论文革新稀疏Transformer
ETHOS论文提出通过超网络组织稀疏性的高效Transformer,在GH200上实现15K tokens/秒的训练速度。