AINews - 2025-08-05
📰 十大AI新闻要点
1. OpenAI发布”Horizon-alpha”模型
OpenAI疑似发布新模型”Horizon-alpha”,在OpenRouter上被发现。该模型在20位数乘法等任务上表现优异,SVG生成能力突出,被推测可能是GPT-5的前身或”nano”版本。
2. 阿里巴巴发布Qwen3-Coder系列
阿里巴巴推出Qwen3-Coder代码模型家族,包括30B参数的Qwen3-Coder-Flash版本,支持1M上下文长度,已在LM Studio和UnslothAI上可用。
3. Cohere发布Command A Vision视觉语言模型
Cohere推出111B参数的开源视觉语言模型Command A Vision,在Hugging Face上提供权重,性能超越GPT-4.1和Llama 4 Maverick。
4. Black Forest Labs发布FLUX.1 Krea模型
Black Forest Labs发布专注于照片级真实感的FLUX.1 Krea模型,可在ZeroGPU上免费运行,支持现有微调工具。
5. 智谱AI发布GLM-4.5
智谱AI推出GLM-4.5模型,统一了代理能力,可在”思考”和”即时”模式间切换,已在Together AI上可用。
6. Runway Aleph全面发布
Runway Aleph向所有付费计划全面开放,展示出在保持角色一致性的同时进行复杂环境变化的能力。
7. Google推出Veo 3 Fast
Google DeepMind发布Veo 3 Fast文本到视频模型,新增图像到视频功能,已在Gemini API中提供。
8. Figma上市
设计平台Figma正式上市,NYSE以”Shipped: $FIG”推文祝贺,标志着该公司的重要里程碑。
9. 中美AI竞赛
吴恩达发表详细观点认为中国在开源模型生态和半导体领域的积极行动使其有望超越美国成为AI领导者。
10. AMD计划推出专用NPU
AMD计划推出面向AI性能的专用独立NPU,类似游戏GPU但专注于PC上的AI任务,可能配备64-1024GB VRAM。
🛠️ 十大工具产品要点
1. LangChain推出Deep Agents
LangChain引入Deep Agents概念,结合规划工具、文件系统、子代理和详细系统提示,同时发布Align Evals以简化LLM评估器构建。
2. vLLM支持Step3 VLM
vLLM项目宣布全面支持Step3视觉语言模型,该模型具有MFA和AFD特性,采用独特的内部注意力机制。
3. Cline获得3200万美元融资
开源代码代理Cline宣布完成3200万美元种子轮和A轮融资,Sam Altman称赞其创始团队合作非凡。
4. Hugging Face推出Tracks
Hugging Face发布100%开源的实验跟踪库Tracks,定位为付费服务的替代品。
5. Midjourney TV实验
Midjourney推出”Midjourney TV”实验功能,提供社区生成趋势视频的直播流。
6. Perplexity AI推出Comet Shortcuts
Perplexity AI发布Comet Shortcuts功能,允许用户用自然语言提示自动化重复性网络工作流程,如/fact-check快捷方式。
7. Wan 2.2流体动力学表现
Wan 2.2在流体/粒子模拟方面表现突出,但存在持续流体流动的技术限制,如静止泪滴会产生不切实际的连续流动。
8. FLUX.1-Krea-dev模型发布
Black Forest Labs发布FLUX.1-Krea-dev模型,旨在生成更难以区分的合成图像,但现有flux-dev LoRAs不兼容,且存在手部渲染问题。
9. 本地Grammarly替代品refine.sh
开发者推出完全离线的Grammarly替代品refine.sh,基于Gemma 3n E4B模型,峰值内存占用低于500MB。
10. Prompt Catalyst游戏概念生成
Prompt Catalyst提供详细提示模板,用于生成欧洲城市蒸汽朋克游戏概念艺术,指定相机视角、分辨率、游戏UI等参数。