AINews - 2025-08-02
📰 十大AI新闻要点
1. OpenAI发布”Horizon-alpha”模型
OpenAI疑似发布新模型”Horizon-alpha”,在OpenRouter上被发现。初始测试显示其在LisanBench表现一般,但启用推理模式后能完成20位数乘法运算,SVG生成能力突出,性能接近或超过Gemini 2.5 Pro。
2. 阿里巴巴发布Qwen3-Coder系列
阿里巴巴发布Qwen3-Coder代码模型家族,包括30B参数的完整版和轻量级Qwen3-Coder-Flash(30B-A3B)版本,支持100万token上下文长度,现已在LM Studio和UnslothAI上可用。
3. Cohere推出Command A Vision视觉语言模型
Cohere发布1110亿参数的开源视觉语言模型Command A Vision,在Hugging Face提供权重下载,性能超越GPT-4.1和Llama 4 Maverick等模型。
4. Black Forest Labs发布FLUX.1 Krea模型
Black Forest Labs推出专为照片级真实感设计的FLUX.1 Krea模型,可在ZeroGPU上免费运行,支持现有diffusers和ostrisai等微调工具。
5. 智谱AI发布GLM-4.5
智谱AI推出GLM-4.5开源模型,统一了智能体能力,可在”思考”和”即时”模式间切换,现已在Together AI平台上线。
6. Runway Aleph全面发布
Runway Aleph AI视频创作工具向所有付费用户开放,展示出在复杂环境变化中保持角色一致性的能力,代表了AI视频创作的新方式。
7. Google推出Veo 3 Fast
Google DeepMind发布Veo 3 Fast文本转视频模型及新的图像转视频功能,现已通过Gemini API提供。
8. Figma成功上市
设计平台Figma正式上市,成为软件行业新晋”十角兽”(decacorn),其AI功能发展备受关注。
9. 中美AI竞赛态势变化
吴恩达指出中国在开源模型生态和半导体领域的积极进展可能使其超越美国,中国顶级开源模型数量已超过西方。
10. AMD计划推出独立NPU
AMD计划推出面向AI性能的独立神经处理单元(NPU),可能提供64GB-1TB显存,专门处理AI工作负载,与游戏GPU区分。
🛠️ 十大工具产品要点
1. LangChain推出Deep Agents
LangChain推出Deep Agents框架,结合规划工具、文件系统、子代理和详细系统提示,同时发布Align Evals评估工具。
2. vLLM支持Step3视觉语言模型
vLLM项目宣布全面支持Step3视觉语言模型,该模型采用独特的内部注意力机制,具有强大的多模态能力。
3. 开源代码代理Cline融资3200万美元
开源代码代理工具Cline完成3200万美元种子轮和A轮融资,获Sam Altman公开称赞。
4. Hugging Face推出Tracks实验跟踪库
Hugging Face发布100%开源的Tracks库,提供实验跟踪功能,定位为付费服务的替代方案。
5. Perplexity AI推出Comet Shortcuts
Perplexity AI发布Comet Shortcuts功能,允许用户用自然语言提示自动化重复性网络工作流程,如”/fact-check”快捷指令。
6. Midjourney测试”Midjourney TV”
Midjourney推出”Midjourney TV”实验功能,实时流式播放社区生成的趋势视频,被描述为”奇怪的催眠效果”。
7. WAN 2.2视频模型支持首尾帧匹配
WAN 2.2视频模型原生支持首尾帧匹配(FLF)功能,可在ComfyUI中实现视频循环输出。
8. Unsloth发布动态4位量化方法
Unsloth推出动态4位量化方法,显著减少内存带宽使用并提升计算速度,同时保持模型精度。
9. DeepSecure代理安全框架开源
DeepTrail开源DeepSecure框架,通过分片密钥架构和macaroons实现代理认证、委托和策略执行。
10. 本地Grammarly替代品refine.sh
开发者推出完全离线的语法检查工具refine.sh,基于Gemma 3n E4B模型,峰值内存占用低于500MB。