reddit_machinelearning_2026-01-03

Reddit ML - 2026-01-03

作者为Qwen3-0.6B模型引入了一种名为“循环注意力”的架构调整，通过结合全局和局部注意力来提升性能。初步实验结果显示，其验证损失和困惑度均优于基线模型。相关代码和模型已开源。

_{作者: /u/Wittica | 发布于: 2026-01-02 12:05}

LEMMA是一个结合蒙特卡洛树搜索与神经策略网络的符号数学引擎，旨在通过神经引导提升传统符号求解器的搜索效率，并确保每一步变换都经过验证。

_{作者: /u/Federal_Ad1812 | 发布于: 2026-01-02 06:51}

这是一个用于社区自我推广的实验性帖子，鼓励发布个人项目、产品信息及合作需求，并需注明价格。禁止滥用和发布短链接。

_{作者: /u/AutoModerator | 发布于: 2026-01-02 03:15}

作者开发了具有类人思维的象棋AI模型，寻求合适的学术会议或期刊（如IJCAI、TMLR）投稿。

_{作者: /u/Fantastic-Nerve-4056 | 发布于: 2026-01-02 17:54}

用户掌握深度学习模型剪枝基础，但不知如何对大模型（如VLM/LLM）进行操作，寻求相关知识与资源指导。

_{作者: /u/MinimumArtichoke5679 | 发布于: 2026-01-02 09:15}

_{作者: /u/Forsaken-Order-7376 | 发布于: 2026-01-02 12:44}

介绍一篇关于自主性大语言模型的综述论文，探讨其推理、行动和交互能力如何相互促进，并展望未来研究方向。

_{作者: /u/pppeer | 发布于: 2026-01-02 12:25}