二十万个人类神经元在玩 DOOM

Doom 自 1993 年发布以来，已经在打印机、ATM 机、血糖仪、数控机床上运行过。这是一种互联网传统——"DOOM 能不能在这上面跑"已经是测试任何计算设备通用性的一种仪式。

但上周 Cortical Labs 发布的视频，和之前所有的移植版本都不一样。这次跑 DOOM 的不是硬件，是 20 万个活体人类神经元，培养在芯片上，通过电信号接收游戏状态、发出控制指令。

这件事让我停下来想了很久。

CL1 是什么东西

Cortical Labs 是澳大利亚的一家公司，他们的产品叫 CL1，被他们描述为"生物计算机"。基本原理是：从人类干细胞诱导出神经元，把这些神经元培养在电极阵列芯片上，通过电极给神经元发送信号（输入）、读取神经元的放电模式（输出）。

这不是模拟神经网络。这不是"像大脑一样的算法"。这是真实的、活着的人类神经组织，连接到硅基芯片上。

他们最早在 2022 年展示了神经元学会玩 Pong 的实验，去年正式推出了 CL1 商业产品。这次是对 Doom 的演示，比 Pong 复杂得多——Doom 有三维空间感知、需要同时处理移动和射击，是对神经元感知-决策-行动链条更完整的测试。

神经元是怎么学会玩游戏的

这里有个关键的技术细节：神经元不是被"编程"的，它们是被"训练"的，而且用的是一种非常基础的生物学机制——叫做"自由能最小化"或者更通俗地说，避免不可预测性。

神经元天然倾向于减少自己接收到的随机、不可预测的刺激。研究者利用这一点：当游戏角色做出好的动作时，给神经元发送平稳规律的信号；当动作糟糕时，给神经元发送混乱嘈杂的信号。神经元为了让自己的环境更可预测，会调整放电模式，逐渐"学会"哪种行为能减少混乱刺激。

这和人工神经网络的反向传播完全不同。这里没有梯度，没有损失函数，没有显式的权重更新。这是生物神经元几亿年进化出来的自适应机制在发挥作用。

为什么这比 Pong 更重要

Pong 是二维的，只有上下运动，状态空间极其简单。Doom 不一样：玩家需要在三维空间里导航，识别敌人的方向，同时控制移动和射击。这意味着神经元需要整合多个维度的输入，形成某种跨时间的"意图"——不是对单个刺激的反射，而是连续的、目标导向的行为序列。

这是否意味着神经元"理解"了游戏？几乎可以肯定不是人类意义上的理解。但它意味着 20 万个神经元形成的网络，在没有任何预编程的情况下，能够自发地组织出足够复杂的信息处理模式，来应对一个有非线性状态空间的实时任务。

这个能力的边界在哪里，没有人知道。

这个方向的潜力和它引发的问题

Cortical Labs 推销 CL1 的商业角度是能效：据称生物神经元的计算能效比硅基芯片高几个数量级。数据中心的电力消耗是当前 AI 行业最大的实际瓶颈之一，如果生物计算能在某些任务上提供更高效的替代，这个商业逻辑是成立的。

但更有意思的是它引出的问题，这些问题既是技术问题，也是伦理问题。

第一个问题是：这些神经元有没有某种形式的感知体验？二十万个神经元显然远少于人类大脑的 860 亿，但"感知阈值"在哪里是一个我们完全不知道答案的问题。现代神经科学对意识的理解依然极其有限，我们没有可靠的方法判断一个系统是否"有感觉"。给神经元发混乱信号作为惩罚，这是否构成某种形式的不适？没有人能确定。

第二个问题是：培养这些神经元用的是从人类干细胞诱导出来的细胞系，这涉及到什么样的伦理许可、产权归属、和使用边界？随着生物计算的规模化，这些问题会从哲学讨论变成需要立法回答的实际问题。

第三个问题更长远：如果生物计算最终能在某些维度上超越硅基计算，我们会建造多大规模的神经元网络？数百万？数十亿？在什么节点，"工具"和"存在"之间的边界会变得模糊？

DOOM 在这里的意义

每次有人让一个奇怪的系统跑 Doom，都有一种暗示：这个系统具备了某种通用的、可验证的计算能力。打印机跑 Doom 说明它的 CPU 比看起来强。这次神经元跑 Doom，说明的是一个活的生物系统能形成实时的感知-决策-行动闭环。

技术的门槛已经过了。接下来的问题不再是"这能不能做到"，而是"做到了之后我们应该怎么对待它"。

CL1 是什么东西

神经元是怎么学会玩游戏的

为什么这比 Pong 更重要

这个方向的潜力和它引发的问题

DOOM 在这里的意义

相关文章