Reddit ML - 2026-03-10
1. 【求助】表示学习中约4万×4万矩阵的PCA——sklearn SVD在128GB内存下仍崩溃,有何实用解决方案?
用户在进行表征学习研究时,对4万×4万协方差矩阵进行完整PCA分解,即使分配128GB内存,使用sklearn的完整求解器仍会崩溃。
作者: /u/nat-abhishek | 发布于: 2026-03-09 15:07
2. [P] fast-vad:一个用 Rust 编写、带 Python 绑定的超快速语音活动检测器。
这是一个强调速度的语音活动检测工具,提供Rust和Python接口,支持批处理和流式处理,基于逻辑回归实现以追求极致性能。
作者: /u/AtharvBhat | 发布于: 2026-03-09 21:54
3. 【研究】用带噪声的数据重新训练CNN,这方法能行吗?
用户尝试通过添加噪声来改进CNN模型,但效果甚微,不确定是否值得继续。
作者: /u/wolfunderdog45 | 发布于: 2026-03-09 18:46
4. [项目] 全新开源MLP符号蒸馏与分析工具项目
SDHCE工具可将训练好的神经网络转化为可读的数学公式,通过提取权重中的概念层次并验证其预测准确性,最终生成可手动实现的简洁符号表达式。
作者: /u/stron44 | 发布于: 2026-03-09 14:43
5. [求助] 求基准测试建议:如何评估图导向生成(GOG)与检索增强生成(RAG)?
作者研究图导向生成(GOG)以替代RAG,需建立评测基准。测试显示GOG能大幅降低算力消耗,但牺牲了LLM的创造性。寻求标准数据集或框架来评估响应质量与资源效率。
作者: /u/BodeMan5280 | 发布于: 2026-03-09 14:27
6. [研究] 轻松将研究数据接入AI智能体
该平台能索引WandB项目与实验数据,供AI智能体分析并生成新假设与实验方案,支持多模态研究数据,旨在提升研究效率。
作者: /u/hgarud | 发布于: 2026-03-09 19:41
7. [R] 为cs.AI方向寻求arXiv认证:Memento——基于片段的LLM智能体记忆系统
作者提出Memento系统,将LLM代理的记忆分解为原子化片段并分类,通过混合检索栈和异步管道实现持久化,以解决会话结束丢失上下文的问题。
作者: /u/Flashy_Test_8927 | 发布于: 2026-03-09 12:13