今日要闻
生成时间:2025-09-30 08:10:26
AI 推荐要点
**FlashAttention 4技术解析**(来源:Twitter)
反向工程揭示FA4约20%速度提升来源:专用warp布局、softmax的exp立方近似、更激进的异步处理
**GraphMend编译器消除PyTorch图中断**(来源:arXiv)
转换Python源码消除FX图中断,RTX 3090/A40上延迟降低75%,吞吐量提升8%
**vLLM v1支持混合模型**(来源:Twitter)
将Mamba/Mamba2、线性注意力作为一等公民支持,Apple芯片上mlx-lm添加批推理
**Claude Sonnet 4.5**(来源:Hacker News)
Anthropic发布新一代模型,在推理、代码和数学能力上显著提升
**SQLite索引的微妙之处**(来源:Hacker News)
深入探讨SQLite索引实现细节和性能优化技巧,为数据库调优提供实践指导
**诊断Linux性能回归问题**(来源:Hacker News)
系统级性能问题诊断方法论,涵盖内核参数、调度器和I/O栈的深度分析
**我们使用Go语言打造了全球最快的数据复制工具**(来源:Hacker News)
为Apache Iceberg贡献分区表写入功能,Go服务可直接写入并即时查询
**Resrap——一个逆向解析器**(来源:Hacker News)
Go开发的代码生成工具,基于ABNF语法规则生成无限长语法正确代码
**在操作系统内核层面实现AI代理的沙盒隔离**(来源:Hacker News)
探讨AI代理安全运行机制,内核级沙盒技术防止恶意代码执行
**GDPVal基准引发激烈讨论**(来源:Twitter)
新基准覆盖美国9大GDP部门44个职业任务,显示模型达”AGI”经济指标77-95%