ai_news_summary_2025-07-06

AINews - 2025-07-06

原文链接

📰 十大AI新闻要点

1. Ilya Sutskever正式担任SSI CEO

OpenAI前首席科学家Ilya Sutskever宣布正式担任Safe Superintelligence Inc.(SSI)的CEO,Daniel Levy担任总裁,Daniel Gross已离职。Sutskever强调公司拥有充足的计算资源和团队,并否认收购传闻。


2. Perplexity AI整合银行卖方研究数据

Perplexity CEO宣布将整合银行卖方研究报告,并已免费提供Morningstar金融研究报告。同时透露未来产品方向将原生集成笔记、会议和头脑风暴功能。


3. Google Veo 3视频生成模型全球发布

Google DeepMind CEO宣布Veo 3视频生成模型现已向全球Gemini Pro用户开放,包括欧洲地区。这是Google目前最先进的视频生成技术。


4. DeepSeek发布R1T2模型

DeepSeek发布R1T2模型,速度提升200%,在GPQA和AIME 24等基准测试中表现显著提升。采用专家组装方法训练,MIT许可证开源。


5. OpenAI推出高价Deep Research API

OpenAI推出Deep Research API,单次调用成本高达30美元。o3-deep-research定价40美元/百万输出token,远高于标准API。


6. Together AI发布DeepSWE软件工程代理

Together AI发布基于Qwen3-32B的DeepSWE软件工程代理,采用强化学习训练,在SWE-Bench-Verified上达到59%准确率。


7. Kyutai开源TTS模型

法国AI实验室Kyutai开源TTS模型,支持实时语音合成(220ms延迟)和10秒语音克隆,但限制直接访问语音嵌入模型。


8. NVIDIA GB300 NVL72开始部署

CoreWeave成为首个部署NVIDIA GB300 NVL72的云提供商,这是目前最强大的AI训练和推理平台之一。


9. MIT研究ChatGPT对大脑影响

MIT研究发现高能力学习者使用LLM进行主动迭代学习,而低能力学习者倾向于获取快速答案,影响深度理解能力。


10. ZLUDA项目实现非NVIDIA GPU的CUDA加速

ZLUDA项目旨在让CUDA应用在非NVIDIA GPU上运行,已取得重大进展,但面临法律和资源挑战。


🛠️ 十大工具产品要点

1. DeepSeek R1T2模型

速度提升200%的开源模型,采用专家组装方法,MIT许可证发布。


2. Kyutai TTS

开源实时TTS系统,支持语音克隆和长文本合成,延迟仅220ms。


3. DeepSWE软件工程代理

基于Qwen3-32B的强化学习代理,在SWE-Bench上达到59%准确率。


4. PrivateScribe.ai本地转录平台

完全本地的MIT许可AI转录平台,专为医疗和法律领域设计。


5. OmniAvatar Wan 1.3B

音频驱动说话头像模型,8GB VRAM即可运行,开源权重已发布。


6. mem0.ai长期记忆集成

可与Gemini 2.5集成的长期记忆系统,用于构建个性化AI应用。


7. Claude Code工作流

Anthropic Claude Code的高级使用配置库,优化开发工作流。


8. lm_eval评估工具改进

评估库启动时间从9秒优化到0.05秒,支持懒加载和模块重构。


9. Torch.compile优化

通过Dynamo追踪Python代码生成优化后的Triton/CUDA内核。


10. CuTeDSL Hopper指南

详解NVIDIA Hopper架构WGMMA和TMA概念的开发指南。