ai_news_summary_2025-07-04

AINews - 2025-07-04

原文链接
## 📰 十大AI新闻要点

### 1. [Ilya Sutskever正式出任SSI CEO](https://twitter.com/ilyasut/status/1940802278979690613)
> OpenAI前首席科学家Ilya Sutskever宣布正式担任Safe Superintelligence Inc. (SSI) CEO，Daniel Levy任总裁，Daniel Gross已离职。Sutskever强调公司拥有充足算力和团队，并否认收购传闻。

---

### 2. [Perplexity AI整合银行卖方研究报告](https://twitter.com/AravSrinivas/status/1940808181296545859)
> Perplexity CEO宣布整合Morningstar等金融机构研究报告，并预告将推出原生集成笔记/会议功能的Comet产品线，Pro用户将很快获得惊喜更新。

---

### 3. [Gemini Veo 3视频模型全球开放](https://twitter.com/demishassabis/status/1940616072304251152)
> Google DeepMind CEO宣布Veo 3视频生成模型向全球Gemini Pro用户开放，包括欧洲市场，标志着谷歌在生成视频领域的重大进展。

---

### 4. [DeepSeek发布R1T2系列模型](https://twitter.com/reach_vb/status/1940536684061643239)
> DeepSeek推出R1T2模型，速度提升200%，在GPQA等基准测试表现优异，采用专家混合架构，MIT许可证开源。同时发布Chimera变体模型。

---

### 5. [OpenAI推出高价Deep Research API](https://twitter.com/ArtificialAnlys/status/1940896348364210647)
> 新分析显示OpenAI推出深度研究API，单次调用成本高达30美元，输出token价格达40美元/百万，远高于标准API定价。

---

### 6. [Together AI开源DeepSWE编码代理](https://twitter.com/tri_dao/status/1940765882227347585)
> 基于Qwen3-32B的软件工程代理DeepSWE开源，采用强化学习训练，在SWE-Bench验证集达到59%准确率，完整工具链公开。

---

### 7. [Kyutai发布开源TTS模型](https://huggingface.co/kyutai/tts-1.6b-en_fr)
> 法国AI实验室Kyutai推出开源文本转语音模型，支持实时生成(220ms延迟)和10秒语音克隆，但限制直接访问声纹模型以确保伦理合规。

---

### 8. [未来AI数据中心耗电量惊人](https://twitter.com/scaling01/status/1940536579183067540)
> 分析指出OpenAI计划中的Stargate数据中心将消耗5GW电力，相当于430万美国家庭用电量，凸显AI基础设施的能源挑战。

---

### 9. [MIT研究揭示ChatGPT对大脑影响](https://arxiv.org/pdf/2506.08872)
> MIT研究发现高能力学习者使用LLM进行知识建构，而低能力学习者依赖快捷答案，可能影响认知负荷和知识内化过程。

---

### 10. [ZLUDA项目实现非NVIDIA GPU的CUDA兼容](https://www.tomshardware.com/software/a-project-to-bring-cuda-to-non-nvidia-gpus-is-making-major-progress)
> ZLUDA项目使CUDA应用能在AMD等GPU运行，已支持PhysX和LLM推理，但面临法律风险和技术挑战。

---

## 🛠️ 十大工具产品要点

### 1. [DeepSWE-Preview编码代理](https://huggingface.co/agentica-org/DeepSWE-Preview)
> 基于Qwen3-32B的强化学习编码代理，在SWE-Bench达到59%准确率，完整训练框架和数据集开源。

---

### 2. [Kyutai TTS实时语音合成](https://github.com/kyutai-labs/delayed-streams-modeling/)
> 开源TTS系统支持220ms超低延迟实时生成，10秒语音克隆，但限制使用预审核声库。

---

### 3. [PrivateScribe本地转录平台](http://privatescribe.ai/)
> MIT许可的全本地AI转录工具，整合Whisper和Ollama，专为医疗/法律场景设计，支持自定义模板。

---

### 4. [OmniAvatar Wan 1.3B语音驱动头像](https://github.com/Omni-Avatar/OmniAvatar)
> 开源1.3B参数语音驱动头像模型，8GB显存即可运行，支持实时生成，社区正开发ComfyUI插件。

---

### 5. [mem0.ai长期记忆集成方案](http://mem0.ai/)
> 实现Gemini 2.5的长期记忆功能，支持构建个性化AI应用，保留历史对话上下文。

---

### 6. [Claude Code开发者工作流](https://github.com/Veraticus/nix-config/tree/main/home-manager/claude-code)
> Anthropic Claude Code的高级用法库，包含CLAUDE.md模板和slash命令，显著提升编码效率。

---

### 7. [lm_eval评估工具链优化](https://github.com/EleutherAI/lm-evaluation-harness/issues/3083)
> 语言模型评估工具启动时间从9秒优化至0.05秒，改进任务发现性和懒加载机制。

---

### 8. [Torch.compile动态编译优化](https://pytorch.org/docs/stable/torch.compiler.html)
> PyTorch动态编译器通过Dynamo生成优化内核，自动融合操作并生成Triton/CUDA代码。

---

### 9. [CuTeDSL Hopper架构指南](https://veitner.bearblog.dev/cutedsl-on-hopper-wgmma-and-tma-intro/)
> 详解NVIDIA Hopper架构WGMMA和TMA指令，提供CUTLASS实例帮助发挥硬件潜力。

---

### 10. [Velma PS Vita版LLM客户端](https://github.com/callbacked/vela)
> 为PS Vita掌机开发的LLM客户端，支持远程推理和摄像头输入，展示边缘设备AI可能性。