reddit_machinelearning_2025-12-28

Reddit ML - 2025-12-28

1. [D] r/MachineLearning 年度回顾

2025年机器学习社区回顾:开源模型(如DeepSeek)推动可及性,但顶级学术会议因投稿量暴增导致评审质量危机,论文造假和AI生成内容问题凸显。同时,行业关注从训练转向推理变现,工程师角色更侧重API集成。

作者: /u/Everlier | 发布于: 2025-12-27 16:04


2. [D] 超大规模数据集的特征选择方法

用户询问在拥有数百个特征的大型数据集(如来自Axciom)中,除了WoE和IV之外,还有哪些特征选择方法。

作者: /u/Babbage224 | 发布于: 2025-12-27 04:02


3. [D] 验证集的有效性检验

提出一种通过多次重采样不同验证集来评估验证集质量的方法,以判断其能否有效检测过拟合。该方法目前基于MNIST数据集进行概念验证。

作者: /u/DepartureNo2452 | 发布于: 2025-12-27 16:16


4. 英伟达与Groq的200亿美元交易无关“垄断”,而是关乎智能体AI的物理本质。

英伟达收购Groq表明单一芯片架构无法兼顾推理速度与容量,未来需混合SRAM的即时响应与HBM的大内存优势。

作者: /u/pmv143 | 发布于: 2025-12-27 16:51