reddit_machinelearning_2026-01-23

Reddit ML - 2026-01-23

1. [深度] NeurIPS 2025 51篇录用论文中发现100处虚假引用

一项研究发现,在NeurIPS 2025的51篇已接收论文中,存在100条AI生成的虚假引用。

作者: /u/mgcdot | 发布于: 2026-01-22 16:32


2. [D] AISTATS 2026 论文录用结果公布

AISTATS 2026会议论文录用结果今日公布,此帖用于讨论相关情况。

作者: /u/mathew208 | 发布于: 2026-01-22 13:28


3. [R] CVPR 2026 评审结果今日公布

作者: /u/gentaiscool | 发布于: 2026-01-22 13:18


4. [R] 批量大小与通道宽度对显存的影响——在4090显卡上训练TCN模型

在RTX 4090上测试TCN模型,发现最大安全批处理大小与通道数成近似反比的幂律关系,预测性很强。

作者: /u/EliHusky | 发布于: 2026-01-22 12:19


5. [讨论] 哪些数据设计模式在生产环境中经得起考验?

用户分享一篇关于数据工程设计模式的文章,并询问社区在支持大规模ML/AI时,哪些模式最可靠、哪些在扩展时失败以及哪些被过度使用。

作者: /u/Aggravating_Map_2493 | 发布于: 2026-01-22 06:07


6. 网络摄像头图像分类是徒劳之举吗?

用户使用TensorFlow通过网络摄像头图像预测海况,但模型在未见过的图像上表现不佳,易被无关物体(如电线杆、栅栏)干扰分类。

作者: /u/dug99 | 发布于: 2026-01-22 09:56


7. [项目] 为LLM网关构建自动故障转移的经验总结

为应对AI服务商宕机,Bifrost开发了自动故障转移系统,通过健康监测和断路器模式,在毫秒内将请求切换至备用服务商,确保应用无感知持续运行。

作者: /u/dinkinflika0 | 发布于: 2026-01-22 19:57


8. ICLR重投ICML,投稿截止日期有重叠

询问ICLR结果公布前,能否将同一篇论文摘要提交给ICML,是否算作重复投稿。

作者: /u/Enjolrasfeyrac | 发布于: 2026-01-22 17:44


9. [讨论] DFDC数据集获取方式

用户因DFDC官网无法访问,寻求获取该深度伪造数据集的其他途径。

作者: /u/Ok_Concert6723 | 发布于: 2026-01-22 06:13


10. [求助] 需要CVPR论文评审意见的回复建议

作者收到CVPR评审,两票边缘接受,一票弱拒绝。拒绝理由非技术问题,而是对会议适配性的误解。询问针对性反驳能否改变结果。

作者: /u/jackeswin | 发布于: 2026-01-22 19:45


11. [R] 对于多模态数据集,有哪些比Perceiver/PercieverIO更好的现代替代方案?

作者开发多模态基础模型,询问是否有比五年前的Perceiver更先进的架构用于处理多传感器数据。

作者: /u/Affectionate_Use9936 | 发布于: 2026-01-22 14:21


12. [R] 我们运行了1150次大语言模型交易测试,发现Claude以平均+38.5%的收益率展现出卓越的金融策略能力。

23个AI模型在模拟交易比赛中,Claude Sonnet 4.5平均盈利38.5%表现最佳。模型展现出不同交易策略,速度快的模型反而亏损,人类表现常垫底。

作者: /u/mw67 | 发布于: 2026-01-22 20:15


13. 冷门观点:vLLM融资1.5亿美元,我认为行业仍在优化错误指标。“吞吐量”已是伪命题,真正的瓶颈在于冷启动延迟。

作者认为AI推理优化的重点应从吞吐量转向延迟,因为当前生成速度已超人类阅读,而多智能体协作的冷启动延迟过高,需将模型视为可快速切换的“函数”而非常驻“服务器”。

作者: /u/pmv143 | 发布于: 2026-01-22 20:52