ai_news_summary_2025-07-06

AINews - 2025-07-06

原文链接

OpenAI前首席科学家Ilya Sutskever宣布正式担任Safe Superintelligence Inc.(SSI)的CEO，Daniel Levy担任总裁，Daniel Gross已离职。Sutskever强调公司拥有充足的计算资源和团队，并否认收购传闻。

Perplexity CEO宣布将整合银行卖方研究报告，并已免费提供Morningstar金融研究报告。同时透露未来产品方向将原生集成笔记、会议和头脑风暴功能。

Google DeepMind CEO宣布Veo 3视频生成模型现已向全球Gemini Pro用户开放，包括欧洲地区。这是Google目前最先进的视频生成技术。

DeepSeek发布R1T2模型，速度提升200%，在GPQA和AIME 24等基准测试中表现显著提升。采用专家组装方法训练，MIT许可证开源。

OpenAI推出Deep Research API，单次调用成本高达30美元。o3-deep-research定价40美元/百万输出token，远高于标准API。

Together AI发布基于Qwen3-32B的DeepSWE软件工程代理，采用强化学习训练，在SWE-Bench-Verified上达到59%准确率。

法国AI实验室Kyutai开源TTS模型，支持实时语音合成(220ms延迟)和10秒语音克隆，但限制直接访问语音嵌入模型。

CoreWeave成为首个部署NVIDIA GB300 NVL72的云提供商，这是目前最强大的AI训练和推理平台之一。

MIT研究发现高能力学习者使用LLM进行主动迭代学习，而低能力学习者倾向于获取快速答案，影响深度理解能力。

ZLUDA项目旨在让CUDA应用在非NVIDIA GPU上运行，已取得重大进展，但面临法律和资源挑战。

速度提升200%的开源模型，采用专家组装方法，MIT许可证发布。

开源实时TTS系统，支持语音克隆和长文本合成，延迟仅220ms。

基于Qwen3-32B的强化学习代理，在SWE-Bench上达到59%准确率。

完全本地的MIT许可AI转录平台，专为医疗和法律领域设计。

音频驱动说话头像模型，8GB VRAM即可运行，开源权重已发布。

可与Gemini 2.5集成的长期记忆系统，用于构建个性化AI应用。

Anthropic Claude Code的高级使用配置库，优化开发工作流。

评估库启动时间从9秒优化到0.05秒，支持懒加载和模块重构。

通过Dynamo追踪Python代码生成优化后的Triton/CUDA内核。

详解NVIDIA Hopper架构WGMMA和TMA概念的开发指南。