ai_news_summary_2025-08-03

AINews - 2025-08-03

原文链接

📰 十大AI新闻要点

1. OpenAI发布”Horizon-alpha”模型

OpenAI疑似发布新模型”Horizon-alpha”,在OpenRouter上被发现。该模型在20位数乘法等任务上表现优异,SVG生成能力突出,被推测可能是GPT-5的前导版本或”nano”版本。

2. 阿里巴巴发布Qwen3-Coder系列

阿里巴巴推出Qwen3-Coder代码模型家族,包括30B参数的Qwen3-Coder-Flash版本,支持1M上下文长度,已在LM Studio和UnslothAI上可用,具备基础代理能力。

3. Cohere发布Command A Vision视觉语言模型

Cohere推出111B参数的开源视觉语言模型Command A Vision,在Hugging Face上提供权重,在企业基准测试中超越GPT-4.1和Llama 4 Maverick。

4. Black Forest Labs发布FLUX.1 Krea模型

Black Forest Labs发布专为照片级真实感设计的FLUX.1 Krea模型,可在ZeroGPU上免费运行,支持现有微调工具开箱即用。

5. 智谱AI发布GLM-4.5模型

智谱AI推出GLM-4.5开源模型,统一代理能力,可在”思考”和”即时”模式间切换,已在Together AI上提供。

6. Runway Aleph全面发布

Runway Aleph AI视频创作工具向所有付费计划开放,展示复杂环境变化同时保持角色一致性的能力。

7. Google推出Veo 3 Fast

Google DeepMind发布Veo 3 Fast文本到视频模型,新增图像到视频功能,现已在Gemini API中提供。

8. Figma上市

设计平台Figma正式上市,NYSE发布”Shipped: $FIG”推文,标志着这一代网络设计平台的重要里程碑。

9. 中美AI竞赛态势

吴恩达发表详细观点认为中国在开源模型生态和半导体领域的积极行动使其有望超越美国成为AI领导者。

10. AMD计划推出专用NPU

AMD计划推出面向AI性能的独立NPU,类似游戏GPU但专为PC AI工作负载设计,可能支持64-1024GB内存。


🛠️ 十大工具产品要点

1. LangChain推出Deep Agents

LangChain引入Deep Agents概念,结合规划工具、文件系统、子代理和详细系统提示,同时发布Align Evals以简化LLM评估器构建。

2. vLLM支持Step3 VLM

vLLM项目宣布全面支持Step3视觉语言模型,该模型采用独特的内部注意力机制,具有强大的多模态能力。

3. Cline获得3200万美元融资

开源代码代理Cline宣布完成3200万美元种子轮和A轮融资,Sam Altman称赞其创始团队合作非凡。

4. Hugging Face发布Tracks

Hugging Face推出100%开源的Tracks库,作为付费实验跟踪服务的替代方案。

5. Modal Labs推出GPU快照功能

Modal Labs引入GPU快照功能,实现vLLM 5秒冷启动,被赞为工程壮举。

6. Perplexity AI推出Comet Shortcuts

Perplexity发布Comet Shortcuts,允许用户用自然语言提示自动化重复性网络工作流,如/fact-check快捷方式。

7. Midjourney TV实验

Midjourney推出”Midjourney TV”实验功能,实时流式播放社区生成的趋势视频,被描述为”奇怪地催眠”。

8. Amazon投资Showrunner

Amazon投资AI生成流媒体服务Showrunner,用户可通过提示生成场景,由Fable Simulation开发。

9. WAN 2.2视频模型

WAN 2.2模型支持”首帧末帧”视频输出,可在ComfyUI中原生使用,提升视频生成效率。

10. 本地Grammarly替代品refine.sh

开发者推出完全离线的Grammarly替代品refine.sh,基于Gemma 3n E4B模型,峰值内存占用低于500MB。