ai_news_summary_2025-08-04

AINews - 2025-08-04

原文链接

📰 十大AI新闻要点

1. OpenAI发布”Horizon-alpha”模型

OpenAI疑似发布新模型”Horizon-alpha”,在OpenRouter上可用。初期测试显示其数学能力较弱,但启用推理模式后能完成20位数乘法运算,SVG生成能力突出,性能媲美或超越Gemini 2.5 Pro。


2. 阿里巴巴发布Qwen3-Coder系列

阿里巴巴发布Qwen3-Coder代码模型家族,包括30B参数的Qwen3-Coder-Flash版本,支持100万token上下文长度,现已在LM Studio和UnslothAI上可用。


3. Cohere发布Command A Vision视觉语言模型

Cohere推出111B参数的开源视觉语言模型Command A Vision,在Hugging Face提供权重下载,性能超越GPT-4.1和Llama 4 Maverick。


4. Black Forest Labs发布FLUX.1 Krea模型

Black Forest Labs发布专为照片级真实感设计的FLUX.1 Krea模型,可在ZeroGPU上免费运行,现有微调工具可即插即用。


5. 智谱AI发布GLM-4.5模型

智谱AI推出GLM-4.5开源模型,统一了代理能力,可在”思考”和”即时”模式间切换,现已在Together AI上可用。


6. Runway Aleph全面发布

Runway Aleph已向所有付费用户开放,展示出复杂环境变化下保持角色一致性的能力,代表了AI创作的新方式。


7. Google推出Veo 3 Fast

Google DeepMind发布更快速、经济的Veo 3 Fast文本到视频模型,并在Gemini API中新增图像到视频功能。


8. 中国开源模型主导HuggingFace排行榜

7月中国开源AI模型如Kimi-K2、Qwen3、GLM-4.5等主导HuggingFace趋势榜,与Meta转向闭源策略形成鲜明对比。


9. Deepseek获ACL 2025最佳论文奖

Deepseek因在长上下文处理方面的突破性创新获得ACL 2025最佳论文奖,其稀疏注意力机制可能显著提升小模型的上下文保留能力。


10. AMD计划推出专用NPU

AMD计划推出面向AI性能的独立NPU,类似游戏GPU但专为PC AI设计,可能支持64-1024GB显存,将边缘AI推向新高度。


🛠️ 十大工具产品要点

1. LangChain推出Deep Agents和Align Evals

LangChain推出结合规划工具、文件系统和子代理的Deep Agents概念,并发布Align Evals工具,便于构建和对齐LLM评估器。


2. vLLM支持Step3视觉语言模型

vLLM项目宣布全面支持具有MFA和AFD功能的Step3视觉语言模型,该模型采用独特的内部注意力机制。


3. Cline开源代码代理融资3200万美元

开源代码代理Cline完成3200万美元种子轮和A轮融资,Sam Altman称赞其创始人合作模式。


4. Hugging Face推出Tracks实验跟踪库

Hugging Face发布100%开源的Tracks库,作为付费实验跟踪服务的替代方案。


5. Midjourney推出”Midjourney TV”实验

Midjourney推出”Midjourney TV”实验功能,实时流式播放社区生成的趋势视频,被描述为”奇怪地催眠”。


6. Perplexity AI推出Comet Shortcuts

Perplexity AI推出Comet Shortcuts功能,允许用户用自然语言提示自动化重复性网络工作流程,如”/fact-check”快捷方式。


7. WAN 2.2支持开箱即用的首尾帧视频

WAN 2.2模型在ComfyUI中原生支持首尾帧视频输出,通过更新现有WAN 2.1 FLF2V工作流即可实现。


8. refine.sh本地语法检查工具

开发者推出完全离线的Grammarly替代品refine.sh,基于Gemma 3n E4B模型,峰值内存占用低于500MB。


9. Prompt Catalyst游戏概念生成教程

Prompt Catalyst提供详细教程,使用特定提示生成蒸汽朋克风格的高保真视频游戏概念艺术,包括UI设计和环境效果。


10. DeepSecure代理安全框架

DeepTrail开源DeepSecure框架,通过分割密钥架构和macaroons实现代理的认证、委托和策略执行,支持跨模型代理。