当理解被外包给 AI

今天 Hacker News 上最值得认真读的一篇文章,不是新模型,也不是新 benchmark,而是一篇带着一点不安的长文。它讨论的核心其实很简单:AI 最危险的地方,也许不是它会不会胡说八道,而是人类会不会越来越习惯在自己并不真正理解的情况下,依然顺利地把事情做完。

这个判断之所以重要,是因为它说中的不是机器的问题,而是人的问题。过去我们讨论 AI 风险,经常把焦点放在幻觉、偏见、失控这些显眼的点上。但在很多真实工作里,更先发生的并不是灾难,而是一种很舒服的滑坡。你不再需要完整读完论文,也能写出摘要。你不再需要彻底弄懂代码,也能修掉 bug。你不再需要从头推导一个结论,也能交出看起来很像样的结果。事情都能推进,产出也没有立刻崩掉,于是你很难在当下感觉到自己失去了什么。

可真正被拿走的,恰恰是那些最慢、最笨、也最珍贵的部分。是你反复读一篇文章时建立起来的结构感,是你调一个 bug 调到怀疑人生之后得到的直觉,是你知道某个结果"不对劲"却一时说不清原因的那种判断力。人真正的能力,很多时候不是"把答案说出来",而是能在答案看起来还没问题时,先察觉哪里不对。这种能力没法靠最后那一下产出指标来衡量,因为它本来就长在过程里。

文章里举的是科研训练的例子,我觉得它对程序员也同样成立。一个新人如果把读文档、拆问题、定位原因、写实验、验证假设这些步骤都大量外包给 agent,他最后也许一样能提交 PR,一样能把任务做完,甚至一样能在周会上汇报得头头是道。但问题在于,这个任务到底有没有真正"长进他脑子里"。如果把工具拿走,他还能不能独立把这件事再做一遍。很多时候,区分一个人是真的会,还是只是暂时借到了能力,就看这里。

这也是为什么我一直觉得,AI 最可能先改变的,不是谁更强,而是谁更容易在"看起来会了"的状态里停下来。因为工具越好,越会把这个假象包装得很自然。以前你不懂一个系统,表现会很明显,代码写不动,问题答不上来,文档读不进去。现在不是这样了。现在你可以借助 agent 迅速越过很多中间摩擦,直接得到一个差不多能工作的版本。对交付来说这当然很好,但对成长来说,它也意味着你更容易错把"完成"当成"掌握"。

这里最麻烦的一点,是制度往往不会主动纠正这个问题。公司考核的是交付,学校考核的是论文,团队考核的是速度,客户考核的是结果。很少有体系会认真奖励你在过程中形成了更扎实的理解。于是从组织视角看,那个真的学会了的人,和那个主要靠工具把事做完的人,短期内可能没有太大区别。可一旦环境变化、需求变复杂、系统出故障、工具不可靠,差距就会突然拉开。前者能接住问题,后者只能继续求助于更强的工具。

所以我觉得,今天这篇文章最有价值的地方,不是喊大家"不要用 AI"。这没什么意义。真正有意义的提醒是,你必须主动区分两种使用方式。第一种是用 AI 加速你已经在形成的理解。第二种是用 AI 替代本该由你自己经历的理解过程。前者会放大能力,后者会空心化能力。它们表面看起来很像,长期后果却完全不同。

怎么避免掉进第二种状态。一个很实际的方法,是在工作里保留一些不能外包的检查点。比如让自己在让 agent 动手之前,先写下你对问题的假设;在接受一段修复之前,先说清楚 bug 为什么会发生;在读完 AI 给出的结论之后,要求自己能不用原话、重新向别人解释一遍;在代码合入之前,至少手动走一次关键路径,确认你真的知道这段改动在做什么。这样做会慢一点,但它能逼着你确认,能力到底是在你身上,还是只是在会话窗口里。

对带新人、做团队管理的人来说,这件事尤其需要警惕。过去我们默认"做一遍"就会学到东西,现在这个假设已经不成立了。因为一个人完全可能在完成任务的同时,几乎跳过了本来最能塑造他的部分。如果团队只看表面输出,很容易把 agent 使用熟练误判成理解能力扎实。长远看,这会让组织内部出现一种很危险的空心化:大家都能产出,但越来越少人真的能解释、诊断和重新发明。

这也是我今天最想记下来的判断。AI 真正可怕的地方,不一定是它替你做错事,而是它让你可以长期不懂也照样把事做下去。人很容易把这种顺滑误认为进步,但很多时候,那只是把理解这件事悄悄外包掉了。

工具当然可以帮我们省时间。嗯,这没什么不好。只是有些时间省掉之后,省掉的并不是摩擦,而是成长本身。