AINews - 2025-08-04
📰 十大AI新闻要点
1. OpenAI发布”Horizon-alpha”模型
OpenAI疑似发布新模型”Horizon-alpha”,在OpenRouter上可用。初期测试显示其数学能力较弱,但启用推理模式后能完成20位数乘法运算,SVG生成能力突出,性能媲美或超越Gemini 2.5 Pro。
2. 阿里巴巴发布Qwen3-Coder系列
阿里巴巴发布Qwen3-Coder代码模型家族,包括30B参数的Qwen3-Coder-Flash版本,支持100万token上下文长度,现已在LM Studio和UnslothAI上可用。
3. Cohere发布Command A Vision视觉语言模型
Cohere推出111B参数的开源视觉语言模型Command A Vision,在Hugging Face提供权重下载,性能超越GPT-4.1和Llama 4 Maverick。
4. Black Forest Labs发布FLUX.1 Krea模型
Black Forest Labs发布专为照片级真实感设计的FLUX.1 Krea模型,可在ZeroGPU上免费运行,现有微调工具可即插即用。
5. 智谱AI发布GLM-4.5模型
智谱AI推出GLM-4.5开源模型,统一了代理能力,可在”思考”和”即时”模式间切换,现已在Together AI上可用。
6. Runway Aleph全面发布
Runway Aleph已向所有付费用户开放,展示出复杂环境变化下保持角色一致性的能力,代表了AI创作的新方式。
7. Google推出Veo 3 Fast
Google DeepMind发布更快速、经济的Veo 3 Fast文本到视频模型,并在Gemini API中新增图像到视频功能。
8. 中国开源模型主导HuggingFace排行榜
7月中国开源AI模型如Kimi-K2、Qwen3、GLM-4.5等主导HuggingFace趋势榜,与Meta转向闭源策略形成鲜明对比。
9. Deepseek获ACL 2025最佳论文奖
Deepseek因在长上下文处理方面的突破性创新获得ACL 2025最佳论文奖,其稀疏注意力机制可能显著提升小模型的上下文保留能力。
10. AMD计划推出专用NPU
AMD计划推出面向AI性能的独立NPU,类似游戏GPU但专为PC AI设计,可能支持64-1024GB显存,将边缘AI推向新高度。
🛠️ 十大工具产品要点
1. LangChain推出Deep Agents和Align Evals
LangChain推出结合规划工具、文件系统和子代理的Deep Agents概念,并发布Align Evals工具,便于构建和对齐LLM评估器。
2. vLLM支持Step3视觉语言模型
vLLM项目宣布全面支持具有MFA和AFD功能的Step3视觉语言模型,该模型采用独特的内部注意力机制。
3. Cline开源代码代理融资3200万美元
开源代码代理Cline完成3200万美元种子轮和A轮融资,Sam Altman称赞其创始人合作模式。
4. Hugging Face推出Tracks实验跟踪库
Hugging Face发布100%开源的Tracks库,作为付费实验跟踪服务的替代方案。
5. Midjourney推出”Midjourney TV”实验
Midjourney推出”Midjourney TV”实验功能,实时流式播放社区生成的趋势视频,被描述为”奇怪地催眠”。
6. Perplexity AI推出Comet Shortcuts
Perplexity AI推出Comet Shortcuts功能,允许用户用自然语言提示自动化重复性网络工作流程,如”/fact-check”快捷方式。
7. WAN 2.2支持开箱即用的首尾帧视频
WAN 2.2模型在ComfyUI中原生支持首尾帧视频输出,通过更新现有WAN 2.1 FLF2V工作流即可实现。
8. refine.sh本地语法检查工具
开发者推出完全离线的Grammarly替代品refine.sh,基于Gemma 3n E4B模型,峰值内存占用低于500MB。
9. Prompt Catalyst游戏概念生成教程
Prompt Catalyst提供详细教程,使用特定提示生成蒸汽朋克风格的高保真视频游戏概念艺术,包括UI设计和环境效果。
10. DeepSecure代理安全框架
DeepTrail开源DeepSecure框架,通过分割密钥架构和macaroons实现代理的认证、委托和策略执行,支持跨模型代理。