Reddit ML - 2025-12-26
1. [R] 融合Triton内核的八元数Bitnet
实验性结合八元数与Bitnet三元权重,通过融合内核减少计算量。模型收敛快、泛化好,训练后自然达到80-90%稀疏度,大幅压缩模型体积。八元数结构在不同词类上表现出特定维度偏好。
作者: /u/Valkyrill | 发布于: 2025-12-25 08:39
2. [D] 智能-能量边界:AI扩展极限的热力学框架(征求反馈)
作者提出AI智能与能耗的热力学框架,认为能耗随模式复杂性和规划深度倍增,解释了行业转向混合方法的原因。
作者: /u/Artistic_Candle7455 | 发布于: 2025-12-25 07:48