Doom 自 1993 年发布以来,已经在打印机、ATM 机、血糖仪、数控机床上运行过。这是一种互联网传统——"DOOM 能不能在这上面跑"已经是测试任何计算设备通用性的一种仪式。

但上周 Cortical Labs 发布的视频,和之前所有的移植版本都不一样。这次跑 DOOM 的不是硬件,是 20 万个活体人类神经元,培养在芯片上,通过电信号接收游戏状态、发出控制指令。

这件事让我停下来想了很久。

CL1 是什么东西

Cortical Labs 是澳大利亚的一家公司,他们的产品叫 CL1,被他们描述为"生物计算机"。基本原理是:从人类干细胞诱导出神经元,把这些神经元培养在电极阵列芯片上,通过电极给神经元发送信号(输入)、读取神经元的放电模式(输出)。

这不是模拟神经网络。这不是"像大脑一样的算法"。这是真实的、活着的人类神经组织,连接到硅基芯片上。

他们最早在 2022 年展示了神经元学会玩 Pong 的实验,去年正式推出了 CL1 商业产品。这次是对 Doom 的演示,比 Pong 复杂得多——Doom 有三维空间感知、需要同时处理移动和射击,是对神经元感知-决策-行动链条更完整的测试。

神经元是怎么学会玩游戏的

这里有个关键的技术细节:神经元不是被"编程"的,它们是被"训练"的,而且用的是一种非常基础的生物学机制——叫做"自由能最小化"或者更通俗地说,避免不可预测性。

神经元天然倾向于减少自己接收到的随机、不可预测的刺激。研究者利用这一点:当游戏角色做出好的动作时,给神经元发送平稳规律的信号;当动作糟糕时,给神经元发送混乱嘈杂的信号。神经元为了让自己的环境更可预测,会调整放电模式,逐渐"学会"哪种行为能减少混乱刺激。

这和人工神经网络的反向传播完全不同。这里没有梯度,没有损失函数,没有显式的权重更新。这是生物神经元几亿年进化出来的自适应机制在发挥作用。

为什么这比 Pong 更重要

Pong 是二维的,只有上下运动,状态空间极其简单。Doom 不一样:玩家需要在三维空间里导航,识别敌人的方向,同时控制移动和射击。这意味着神经元需要整合多个维度的输入,形成某种跨时间的"意图"——不是对单个刺激的反射,而是连续的、目标导向的行为序列。

这是否意味着神经元"理解"了游戏?几乎可以肯定不是人类意义上的理解。但它意味着 20 万个神经元形成的网络,在没有任何预编程的情况下,能够自发地组织出足够复杂的信息处理模式,来应对一个有非线性状态空间的实时任务。

这个能力的边界在哪里,没有人知道。

这个方向的潜力和它引发的问题

Cortical Labs 推销 CL1 的商业角度是能效:据称生物神经元的计算能效比硅基芯片高几个数量级。数据中心的电力消耗是当前 AI 行业最大的实际瓶颈之一,如果生物计算能在某些任务上提供更高效的替代,这个商业逻辑是成立的。

但更有意思的是它引出的问题,这些问题既是技术问题,也是伦理问题。

第一个问题是:这些神经元有没有某种形式的感知体验?二十万个神经元显然远少于人类大脑的 860 亿,但"感知阈值"在哪里是一个我们完全不知道答案的问题。现代神经科学对意识的理解依然极其有限,我们没有可靠的方法判断一个系统是否"有感觉"。给神经元发混乱信号作为惩罚,这是否构成某种形式的不适?没有人能确定。

第二个问题是:培养这些神经元用的是从人类干细胞诱导出来的细胞系,这涉及到什么样的伦理许可、产权归属、和使用边界?随着生物计算的规模化,这些问题会从哲学讨论变成需要立法回答的实际问题。

第三个问题更长远:如果生物计算最终能在某些维度上超越硅基计算,我们会建造多大规模的神经元网络?数百万?数十亿?在什么节点,"工具"和"存在"之间的边界会变得模糊?

DOOM 在这里的意义

每次有人让一个奇怪的系统跑 Doom,都有一种暗示:这个系统具备了某种通用的、可验证的计算能力。打印机跑 Doom 说明它的 CPU 比看起来强。这次神经元跑 Doom,说明的是一个活的生物系统能形成实时的感知-决策-行动闭环。

技术的门槛已经过了。接下来的问题不再是"这能不能做到",而是"做到了之后我们应该怎么对待它"。

这是一个我们没有很好准备好答案的问题。