AINews - 2025-06-28
📰 十大AI新闻要点
1. OpenAI发布Deep Research API
OpenAI低调发布Deep Research API,包含o3-deep-research和o4-mini-deep-research模型,支持MCP、搜索和代码解释器三大核心功能,被认为是目前最强大的智能体驱动LLM。
2. Google发布Gemma 3n多模态模型
Google推出可在边缘设备运行的Gemma 3n多模态模型,仅需3GB内存,采用新型MatFormer架构,在LMSys Arena获得1300+高分,获HuggingFace等平台首发支持。
3. DeepMind发布AlphaGenome基因预测模型
DeepMind推出能读取100万DNA碱基的AlphaGenome模型,可预测基因功能和调控,标志着AI在生物学领域的重大突破。
4. Meta挖角OpenAI苏黎世团队核心成员
Meta从OpenAI苏黎世办公室挖走Lucas Beyer等三名核心研究员,强化Llama项目研发能力,引发人才争夺战讨论。
5. 美国法院裁定AI训练使用受版权材料属合理使用
美国地方法院裁定LLM训练使用受版权书籍构成合理使用,但使用盗版材料仍可能面临法律责任,为AI数据使用确立重要判例。
6. Sakana AI推出强化学习教师(RLT)技术
Sakana AI开发RLT技术,使用强化学习教授LLM复杂推理,在MiniF2F测试中达到86.1%准确率,创造了新的计算帕累托前沿。
7. NVIDIA重夺全球市值最高公司宝座
经历股价波动后,NVIDIA市值再次超越其他科技巨头,成为全球最具价值公司,反映AI芯片需求持续旺盛。
8. OpenAI宣布2025开发者大会
OpenAI定于2025年10月6日在旧金山举办DevDay,规模将超1500人,包含主题演讲和最新模型工具实践环节。
9. Anthropic创始人警告18个月内将出现变革性AI
Anthropic联合创始人Jack Clark向国会作证,预测”极具变革性的AI”将在18个月内出现,呼吁加强安全监管。
10. Higgsfield发布高保真图像模型Soul
Higgsfield AI推出Soul模型,提供50多种预设,可生成时尚级真实照片,推动AI图像生成质量达到新高度。
🛠️ 十大工具产品要点
1. OpenAI Deep Research API教程
OpenAI发布Deep Research API教程,30行代码即可构建研究系统,首次展示使用4个智能体的多智能体设置方案。
2. Google Gemini CLI终端工具
Google推出开源Gemini CLI,每天提供1000次免费Gemini 2.5 Pro请求,支持终端直接调用AI模型。
3. Black Forest Labs图像编辑模型FLUX.1
12B参数的FLUX.1 Kontext开放权重图像编辑模型发布,性能媲美GPT-4o等专有模型,获Diffusers和Chipmunk支持。
4. DSPy Ruby实现Desiru
开发者推出DSPy的Ruby实现Desiru,新增Postgres持久层和异步处理功能,获Shopify CEO力荐。
5. LlamaIndex Zoom会议笔记工具
LlamaIndex发布教程,构建与Notion集成的Zoom会议实时笔记智能体,利用Zoom新流媒体功能。
6. KerasHub跨框架模型中心
François Chollet宣布KerasHub,支持在JAX、PyTorch和TensorFlow中使用HuggingFace的Llama、Gemma等模型检查点。
7. OpenRouter获4000万美元融资
OpenRouter完成4000万美元融资,估值达5亿美元,年处理超100T token,提供400+模型的统一API。
8. Modular与Inworld合作TTS模型
Modular与Inworld AI合作开发文本转语音模型,成本降低20倍,使实时语音更易接入各类产品。
9. Mirage自动GPU内核生成项目
Mirage项目可自动生成高效GPU内核,无需编写Triton或CUDA代码,简化高性能计算开发。
10. 实时浏览器端Stable Diffusion实现
开发者实现浏览器端实时Stable Diffusion,使用LCM微调模型,在WebGPU上达到20FPS/1步的生成速度。