hacker_news_top_comments_2026-01-23

Hacker News 高赞评论 - 2026-01-23

1. j2kun在”GPTZero发现NeurIPS 2025录用论文中的100个新幻觉”中的新评论

我抽查了一篇被标记的论文(来自谷歌,有我一位同事合著)。

这篇论文是 https://openreview.net/forum?id=0ZnXGzLcOg,被标记的问题是“遗漏了两位作者,并添加了一位(Kyle Richardson)。这篇论文发表在ICLR 2024上。”也就是说,对于一篇被引用的论文,作者列表有误,发表会议也不对。而且这个引用出现在论文的背景介绍部分,并非论文有效性的核心依据。所以这个引用并非捏造,只是归属错误(可能是使用了AI自动补全功能导致的)。

我认为他们的数据集中确实存在一些严重问题的论文,这个错误也确实让我停下来思考,这篇论文的其他部分有多少是借助了AI。话虽如此,数据集中那些“单一错误”的论文似乎和我检查的这篇类似:都是相对无害的小错误(通过DOI检查器能立刻发现)。因此我不得不推测,其中一些论文被纳入数据集,主要是为了放大作者对其产品的宣传。这招奏效了。

作者: j2kun | 发布于: 2026-01-22 18:52


2. mortsnort在“Qwen3-TTS系列现已开源:语音设计、克隆与生成”中的新评论

他们就是在等评论区里有人问呢!

作者: mortsnort | 发布于: 2026-01-22 16:26


3. 用户testing22321在《欧洲风电与太阳能发电量首超化石燃料》一文中的新评论

美国的太阳能价格简直离谱,这完全是在保护那些收买了所有政客的石油和天然气集团。

我在加拿大。得益于5000加元的补贴和8000加元的无息贷款,我们在屋顶安装了7.6千瓦的太阳能系统,自己没花一分钱。

它每年能发7.72兆瓦时的电,价值约1000加元。我们这里山谷狭窄,雪量很大。我们用贷款覆盖了成本,分8年还清,之后大约20年里每年都能白赚1000加元。这简直是史上最不用动脑子就能做的决定。

我父亲在澳大利亚维多利亚州,刚刚花了4000澳元(约合2700美元)就完全安装并运行了一个10.6千瓦的系统。

澳大利亚白天的电力如此充裕,他们甚至正在讨论在中午时段为所有人提供免费电力。

(链接:https://www.abc.net.au/news/2025-11-03/energy-retailers-offe...)

作者: testing22321 | 发布于: 2026-01-22 15:38


4. cogman10 在“GPTZero 发现 NeurIPS 2025 录用论文中的 100 个新幻觉”中的新评论

啧,这真的会严重损害科学研究。

论文伪造数据/样本等问题已经存在,大语言模型(LLM)能生成看似合理的论文只会让情况更糟。

不过往好处想,也许这能促使科学界和科学记者最终更认真地对待可重复性问题。我希望未来的报道不再是“研究发现能实现y效果的惊人化学物质x”,而是“研究人员成功复现了化学物质x实现y效果的惊人结果,该成果最初由z发现”。

作者: cogman10 | 发布于: 2026-01-22 15:34


5. koliber在“若以垃圾报告浪费我们时间,我们将公开封禁并嘲笑你”中的新评论

我在印度观察到一个有趣的现象。如果我在街上向人问路,他们总会给我一个答案,即使他们并不知道。如果他们不知道,就会编造一个。

这很奇怪。我问了很多印度人,他们说这与“保全面子”有关。说“我不知道”是件丢脸的事。所以如果不知道答案,他们就会编造一个。

你见过这种情况吗?

这种行为在软件项目中也会出现。这样工作起来很困难。

作者: koliber | 发布于: 2026-01-22 13:02


6. MarginalGainz 在“eBay 用户协议更新中明确禁止 AI‘代购’代理”中的新评论

这项禁令与“公平”或防范机器人无关,其核心目的是保护“印象漏斗”。

像eBay这样的平台,其商业模式本质上是将“游移的注意力”货币化——无论是推广商品、“其他顾客还购买了”的推荐,还是侧边栏广告。

而AI智能体代表的则是“高度聚焦的注意力”。它执行交易时注意力毫不游移。这实际上将电商平台降格成了一个商品化的后端数据库/无差异的传输管道。

从增长和单位经济学的角度来看,AI智能体是噩梦般的客户。它产生冲动消费的概率为零,带来的广告收入也为零。平台封禁它们是为了挽救自己的商业模式,而非保护商品库存。

作者: MarginalGainz | 发布于: 2026-01-22 12:14


7. freakynit 在“若以垃圾报告浪费我们时间,我们将公开封禁并嘲笑你”中的新评论

我是印度人(在科技行业工作15年以上)。我经常看到这种行为,不幸的是,我职业生涯早期自己也做过一些类似的事。

根据我的个人经验,这里有几个原因(可能还有更多):

  1. 与大多数发达国家不同,在印度(以及许多其他发展中国家),人们几乎被要求无条件尊重权威。质疑经理、老师或上级通常被视为不尊重或无能的表现。因此,许多人不会要求澄清,而是直接“做点什么”,并希望结果能被接受。你可以把这看作日本办公室文化的温和版本,但它不仅限于办公室……在社会中几乎无处不在。

  2. 我们的教育体系主要奖励结果,而不是结果的质量或思考深度。当然,更好的答案会得到更高的分数,但“合格”和“优秀”之间的差距通常没有得到太多强调。这源于规模问题(学生数量庞大)、极低的中位数收入(约2400美元/年),以及教师培训不足——尤其是在大城市以外。许多教师自己就是死记硬背答案,并期望学生给出匹配的输出。这种情况正在慢慢改善,但伤害已经造成。

  3. 对大多数人来说,印度的薪酬仍然严重偏低(真的非常低),且工作时间长达12-14小时以上,甚至超过中国的996文化,就业市场也极其竞争激烈。对许多学生和初级从业者来说,简历上列出一长串“项目”、PR记录或知名经历往往是脱颖而出的唯一途径。数量常常胜过质量。随着大语言模型(LLM)的出现,这个问题被进一步放大了。

建议:如果你想从印度工程师(或设计师,或任何其他角色)——尤其是初级员工——那里获得更好的成果(就目前而言,未来情况可能改变),请尽早尝试缩小“权威”差距。明确表示你易于沟通,并且提问是受期待的。在最初几周,以你希望他们遵循的方式与他们紧密合作……一旦他们感到安全,通常能非常快地适应。

作者: freakynit | 发布于: 2026-01-22 12:06


8. causalscience 在“若以垃圾报告浪费我们时间,我们将公开封禁并嘲笑你”中的新评论

印度学生

这是文化差异吗?几年前我经营过一家小公司(后来倒闭了),当时雇佣了一些合同工。我注意到一个现象:印度承包商从来不会要求澄清,从不说自己不知道某件事,也从不说自己不理解某个问题等等。相反,他们只会按照自己脑子里想的去做,直到我指出问题。如果他们做得不好而我没有指出来,据我所知他们永远不会回头反思“我做对了吗?我能不能做得更好?”。我无法理解这种态度——在我日常工作中,我有时也会“先做起来”,但我会定期和经理确认:“嘿,这是你想要的对吧?”。这样做几乎没什么坏处。

你的评论让我想起了我的经历,从某种意义上说,它们都是一种“假装会做直到真会做”的心态。

作者: causalscience | 发布于: 2026-01-22 11:30


9. nchmy在“若以垃圾报告浪费我们时间,我们将公开封禁并嘲笑你”中的新评论

最近我在帮忙处理OWASP文档时,发现大量印度学生热衷于提交毫无意义的issue和PR,而且所有的沟通和代码明显100%来自大语言模型。他们甚至还会互相来回讨论。这对维护者来说真是头疼不已。

我建议效仿Ghostty的做法,一切从讨论开始——只有维护者能创建issue,而PR必须基于issue才能提交。看起来这种方式应该能遏制这类偷懒的行为。

作者: nchmy | 发布于: 2026-01-22 11:12


10. mcv在“你的大脑与ChatGPT:使用AI助手时认知债务的积累”中的新评论

这似乎印证了我过度使用AI时的感受。上手很容易,但我能感觉到自己的大脑对问题的投入程度不如以往。它可能成为真正理解的障碍,并让我难以进入心流状态。

最近我处理了一个非常复杂的问题——基于Sugiyama框架的层次化图形布局算法,其中使用Brandes-Köpf方法进行节点定位。如果没有AI,我不可能如此快速地攻克它。我对此毫无经验(而且明显低估了它的复杂度),AI在帮助我初步理解算法结构、众多步骤与子算法、其中微妙的相互作用和隐含假设方面发挥了巨大作用。但让它直接编写代码是个错误。这使我无法理解精妙之处,无法真正深入问题本质,导致我持续依赖AI来修复问题——而到了这个阶段,AI显然也不清楚自己在做什么,只会让情况更糟。

于是我改变了策略:不再让AI接触实际代码,而是从Copilot IDE插件切换到独立的Copilot 365应用。在那里,它可以解释每个步骤背后的原理,由我来调试修复代码,逐步建立对运行机制的实际理解。最终,我重新找回了编程的心流状态。

所以,不要让AI接管你的实际工作,而应将其视为互动式百科全书。对于这类复杂问题,这样的使用方式效果要好得多。

作者: mcv | 发布于: 2026-01-22 08:16


11. Animats在“尽管有联邦援助,美国农场损失依然严重”中的新评论

这很大程度上是一个反垄断问题。

农业的投入品,特别是种子、化肥和农机,都被垄断或近乎垄断的企业控制。并购整合实在太多了。

在销售端,则存在买方垄断或近乎买方垄断的情况,大型收购商寥寥无几[1]。农民被夹在中间,在两端都几乎没有定价权。

这一点基本没有争议。虽然存在反垄断诉讼,但处罚力度薄弱,执法也不到位。

[1] https://equitablegrowth.org/competitive-edge-big-ags-monopso...

作者: Animats | 发布于: 2026-01-22 08:01


12. csours在”尽管有联邦援助,美国农场损失依然严重”中的新评论

在乡村美国人钟爱的所有“枪”中,最受青睐的莫过于那不起眼的“脚枪”(指自己造成的麻烦)。


关于其中的道德、伦理、经济和政治问题,自有他人去争论。但极其简单的事实是:美国联邦政府机构本质上是一台将财富从城市重新分配到乡村的机器。

而乡村美国民众却以高票支持停止这些补贴。这就是他们所谓的“效率”。


成熟意味着暂时搁置判断,去倾听那些你不同意的人的声音——但我觉得,这种做法如今已经非常过时了。

作者: csours | 发布于: 2026-01-22 03:58


13. gpt5在“互联网投票不安全,不应在公共选举中使用”中的新评论

公开选举最重要的特性是信任。效率是最不重要的特性之一。

当我们从有公众监督计票的纸质投票转向电子投票时,我们极大地损害了信任,使得敌对政府伪造选票变得容易得多,而这一切仅仅是为了效率上微不足道的提升——这种提升实际上无关紧要。

转向互联网投票将进一步损害选举过程,并可能使我们陷入完全失去对选举过程的控制和信任的境地。

我们应该回归纸质投票。

作者: gpt5 | 发布于: 2026-01-22 01:24


14. 用户 spicyusername 在“Claude 的新章程”中的新评论

客观真理

    道德绝对性

我很期待你能把这两者联系起来。

一本关于这个话题写得好的书,确实可能让你发财。

    这否定了任何固定、普世的道德标准

这可能是因为我们尚未发现任何普世的道德标准。

作者: spicyusername | 发布于: 2026-01-21 22:53


15. akersten 在“Spotify 获法院命令,Anna’s Archive 的 .org 域名被下线”一文中发表新评论

但你甚至无法从那个.org网站下载所谓的侵权材料。你只能阅读相关描述?所以他们这是在滥用《全令状法案》来关停一个他们认为未来可能对其业务产生某种不确定模糊威胁的网站。如果我之前还不支持安娜,现在肯定站在她这边了。

作者: akersten | 发布于: 2026-01-21 22:21


16. 用户 nsm 在《Skip 现已免费开源》中的新评论

一个简单的事实是,开发者们期望免费获得他们的工具。

这句话准确但尖锐地指出了,地球上一些收入最高的人群却不愿为工具付费,这与几乎所有其他行业都不同。

朋友们,如果你负担得起,请为优质软件付费吧,而不是依赖FAANG(大型科技公司)和风险投资的钱来维持这些工具的运转!

作者: nsm | 发布于: 2026-01-21 22:15


17. 用户 levocardia 在《Claude 的新宪法》中的新评论

唯一让我担心的是博文中的这段话:

本宪章是为我们的主流、通用访问的Claude模型所撰写。我们有一些为特殊用途构建的模型不完全符合此宪章;随着我们继续为特定用例开发产品,我们将持续评估如何最好地确保我们的模型符合本宪章概述的核心目标。

当我读到这段时,脑海中总有个声音挥之不去:“这句话意味着各种政府机构正在使用没有那些烦人道德约束的‘解绑版’模型。”希望我的理解是错的。

作者: levocardia | 发布于: 2026-01-21 20:59


18. 用户 staticshock 在《Claude 新宪法》中的新评论

你说得完全正确!

作者: staticshock | 发布于: 2026-01-21 19:45


19. Nextgrid在”Tell HN: Bending Spoons昨日几乎裁掉了Vimeo所有员工”中的新评论

我很惊讶有这么多人竟然不理解Bending Spoons的商业模式,或者对此感到困惑。

在传统的基础设施和产品开发中,你需要工程团队来构建产品;一旦产品建成,你几乎就不再需要工程师了。就像你盖了一栋房子,房子盖好后你不会继续把建筑工人留在工资单上让他们“继续建造”——你可能需要维护人员,但仅此而已。如果你需要保留完整的建筑团队,那肯定是哪里出了问题,你甚至可能想要求退还最初的建筑费用,因为他们实际上并没有完成建造。

建筑工人、电工和工匠要么作为承包商工作,并考虑到这一点(收取更高的费率以补偿工作的不稳定性),要么为那些在建筑项目上转售他们服务的公司全职工作(相应地收费以确保有足够的收入来支付这些工匠的全职工资)。

科技行业在这方面是个例外,因为零利率政策(ZIRP)允许公司在产品达到市场契合度、产品已经稳定并完成后,仍然保留完整的工程团队来“持续工程化”产品。这让许多工程师产生了一种错觉,认为对单一产品或服务进行永无止境的“工程化”是一种可持续的模式和职业。

Bending Spoons的商业模式是购买已完成的产品,裁掉冗余人员,然后继续运营该产品并从中实际获利。这在其他所有行业一直都是正常现象。

对于那些自视为建造者的科技从业者来说,这应该是正常且可预期的——他们应该为自己的服务收取有竞争力的费率,同时要考虑到他们是在为他人建造某样东西,一旦建成,他人将从中获利,而他们自己则不会参与其中(除非他们想谈判获得公司的实际股份)。对于那些没有这种认知的科技从业者来说,这是一次艰难的警醒,但越早越好——因为旧的情况从一开始就不可持续。

作者: Nextgrid | 发布于: 2026-01-21 18:23


20. leeoniya 在 “Show HN: ChartGPU – 基于 WebGPU 的图表库(百万级数据点,60帧/秒)” 中的新评论

uPlot 维护者在此。这个看起来挺有意思的,我很快会深入了解一下 :)

快速浏览了一下那个100万数据点的演示,有些初步想法:

  • 采样有可能会抹掉重要的峰值,uPlot 不做采样,所以要进行公平的性能对比,你得把采样关掉。关于 LTTB 算法的缺点,详见 https://github.com/leeoniya/uPlot/pull/1025

  • 在空闲/无操作状态下,CPU 占用率依然很高。而基于 Canvas 的方案在图表没有主动更新(新数据或缩放范围变化)时,CPU 使用率是零。我觉得在 WebGPU 的情况下,通过添加一些暂停更新的代码应该能解决这个问题。

  • 在同一个页面用 GL 创建多个图表(比如仪表盘),历来有个限制:Chrome 最多只能同时获取 16 个活跃的 GL 上下文。Plotly 最终通过使用 https://github.com/greggman/virtual-webgl 绕开了这个限制。

数据格式:[[0, 1], [1, 3], [2, 2]]

这种数据格式不幸地需要分配数百万个小数组。我建议切换到列式数据布局。

如果你感兴趣,uPlot 有一个 200 万数据点的演示在这里:https://leeoniya.github.io/uPlot/bench/uPlot-10M.html

作者: leeoniya | 发布于: 2026-01-21 18:20