AINews - 2025-07-05
📰 十大AI新闻要点
1. Ilya Sutskever正式出任SSI CEO
OpenAI前首席科学家Ilya Sutskever宣布正式担任Safe Superintelligence Inc.(SSI) CEO,Daniel Levy任总裁。确认Daniel Gross已离职,并强调公司拥有充足算力和团队资源,否认收购传闻。
2. Gemini Veo 3视频模型全球开放
Google DeepMind CEO宣布Veo 3视频生成模型向所有Gemini Pro用户全球开放,包括欧洲地区,标志着谷歌在生成式视频领域的重大进展。
3. DeepSeek发布R1T2系列模型
DeepSeek推出R1T2模型,速度提升200%,在GPQA和AIME 24等基准测试表现优异。采用专家组装方法训练,MIT许可证开源。
4. OpenAI推出高价Deep Research API
新分析显示OpenAI推出深度研究API端点,单次调用成本高达30美元,输出token价格达40美元/百万,远高于标准API定价。
5. Perplexity整合银行卖方研究报告
Perplexity CEO宣布整合Morningstar等金融机构研究报告,并预告将推出原生集成笔记/会议功能的Comet产品线。
6. Kyutai开源TTS模型
法国AI实验室Kyutai发布开源文本转语音模型,支持实时生成(220ms延迟)和语音克隆,但限制直接访问声纹模型以保护隐私。
7. Together AI发布DeepSWE编码代理
基于Qwen3-32B强化学习训练的软件工程代理,在SWE-Bench验证集达到59%准确率,完整训练工具包开源。
8. Meta研究架构调整
Meta研究人员澄清FAIR实验室与GenAI/MSL团队的区别,前者为精英小团队,后者负责大规模模型训练。Nat Friedman加入负责AI产品开发。
9. AI基础设施耗电量惊人
分析指出OpenAI计划中的Stargate数据中心将消耗5GW电力,相当于430万美国家庭用电量,凸显AI算力扩张的能源挑战。
10. Kling AI展示电影级视频生成
中国视频生成初创公司Kling发布高质量短片,展示其在叙事连贯性和视觉表现上的突破性进展。
🛠️ 十大工具产品要点
1. DeepSeek-TNG R1T2 Chimera模型
DeepSeek发布的Chimera变体模型,采用特殊架构融合技术,在HuggingFace开源。
2. mem0.ai长期记忆集成方案
展示如何将mem0.ai的长期记忆系统与Gemini 2.5集成,构建个性化记忆的AI应用。
3. PrivateScribe本地转录平台
基于Whisper的完全本地化MIT许可转录工具,专为医疗/法律场景设计,支持自定义模板。
4. ZLUDA非NVIDIA GPU加速项目
让CUDA应用在AMD等GPU上运行的开源项目,面临法律和技术挑战但取得进展。
5. OmniAvatar Wan 1.3B模型
开源音频驱动虚拟形象模型,8GB显存即可运行,支持实时生成。
6. Claude Code编程工作流
用户分享高级Claude Code配置库,展示如何通过定制指令库提升开发效率。
7. LangGraph底层框架探讨
LangChain创始人调研开发者对LangGraph底层事件驱动框架的兴趣,可能开放更底层API。
8. LM Evaluation Harness优化
开源评估工具启动时间从9秒优化至0.05秒,通过延迟加载和导入重构实现。
9. Torch.compile编译优化
PyTorch的AOT编译方案,自动生成优化后的Triton/CUDA内核,显著提升运行效率。
10. CuTeDSL Hopper架构解析
详解NVIDIA Hopper架构的WGMMA和TMA特性,提供CUTLASS实例参考。