Reddit ML - 2026-01-02
1. DeepSeek新论文:mHC——流形约束超连接
DeepSeek提出mHC框架,通过将超连接的残差空间投影到特定流形来恢复恒等映射特性,解决了训练不稳定和可扩展性问题,提升了模型性能。
作者: /u/Nunki08 | 发布于: 2026-01-01 10:38
2. [P] 特征值作为模型:可扩展性、鲁棒性与可解释性
作者探讨了在模型中使用矩阵特征值作为“非线性”的方法,并分析了此类模型在扩展性、鲁棒性和可解释性方面的特性,指出矩阵谱范数在其中起关键作用。
作者: /u/alexsht1 | 发布于: 2026-01-01 11:00
3. [D] 图像与视频推理:模块化流程 vs 端到端视觉语言模型
作者探讨了超越单帧理解后,如何对图像视频进行推理。认为端到端视觉语言模型在处理长视频、稳定追踪和精确计数时存在局限,因此提出模块化方案:专用视觉模型感知,LLM对结构化输出进行推理。
作者: /u/sjrshamsi | 发布于: 2026-01-01 17:09
4. [项目] 我开发了一个可直接替代Scikit-Learn的SVD/PCA工具,能自动选择最佳秩(基于Gavish-Donoho方法)
作者开发了randomized-svd库,提供自动秩选择、稀疏矩阵虚拟中心化等功能,旨在简化SVD和PCA流程并节省内存。
作者: /u/Single_Recover_8036 | 发布于: 2026-01-01 15:21
5. 我开发了一款桌面工具,用于检查和调试向量数据库与嵌入向量
作者开发了VectorDBZ桌面工具,用于可视化调试和探索多种向量数据库,支持连接、浏览、搜索和可视化嵌入数据,旨在加速检索系统的分析过程。
作者: /u/snirjka | 发布于: 2026-01-01 16:02
6. [D] 一键获取所有Kaggle竞赛的元数据文件
作者创建了一个网站,可将Kaggle竞赛的元数据、数据集架构和多个笔记本整合成一个Toon格式的上下文文件,并征求反馈。
作者: /u/Low-Mastodon-4291 | 发布于: 2026-01-01 18:56
7. [讨论] 简单问题讨论帖
这是一个机器学习子版块的集中提问帖,鼓励用户在此提问而非单独发帖,以保持版面整洁。
作者: /u/AutoModerator | 发布于: 2026-01-01 16:00