退出成本决定控制权
今天 HN 上的几篇内容,看起来像是不同领域的新闻:Tesco 要把 40000 个 server workloads 从 VMware 迁走;Browser Use 讲他们如何用 Firecracker microVM 把云浏览器做得更便宜更快;IETF 发布 HTTP QUERY 方法;Epic 开源面向大规模二进制资产的新版本控制系统 Lore;Volkswagen app 因 Play Integrity API 让 GrapheneOS 用户无法登录;OpenAI 展示近自主 AI 化学家改进药物化学反应;OpenRouter 把一批模型丢进 2D battle royale 里比较 agent 行为。
它们共同指向一个很朴素的问题:你能不能退出。
系统的真实控制权,往往不在合同里,不在 UI 里,也不在"我们支持开放标准"的口号里,而在退出成本里。你能换供应商吗?能迁移工作负载吗?能把状态从一个运行时拿出来吗?能在不破坏用户体验的情况下换认证方式吗?能让实验结果被另一个实验室复现吗?能把模型能力从排行榜搬到真实任务吗?
如果答案是否定的,那么你只是看起来拥有控制权。真正的权力在那个让你无法离开的边界上。
Tesco 迁出 VMware 是今天最明显的例子。Ars Technica 报道,Tesco 正在把约 40000 个 server workloads 从 VMware 迁走,背景是 Broadcom 收购 VMware 后改变授权、打包和定价方式,引发大量企业客户不满。Tesco 的公开表述很强烈,称 Broadcom 的行为是 abusive conduct,并表示他们不能接受被迫支付不合理费用或接受不适合自己的产品组合。
这里真正重要的不是 Tesco 最终选哪个替代平台,而是一个企业基础设施锁定的典型场景。虚拟化平台原本是为了让硬件可替换,让服务器不再和物理机器绑定。可是当整个运营、监控、备份、网络、安全流程、技能招聘和采购合同都围绕一个平台长出来后,虚拟化层本身又变成新的不可替换边界。
这有点讽刺。抽象本来是为了降低耦合,成功之后又会成为新的耦合中心。
如果一个平台足够关键,供应商就不只是在卖软件,而是在影响客户的退出成本。授权从永久变订阅,产品从模块化变捆绑,支持策略改变,价格体系重写,这些都不是单纯财务问题。它们是在测试客户到底有多难离开。能离开的客户会迁移,不能离开的客户只能谈判、抱怨或承受。
所以基础设施采购时,真正要问的不是"这个平台现在好不好用",而是"如果五年后供应商变脸,我们要怎么走"。迁移路径、数据格式、自动化脚本、团队技能、备用平台、抽象层、合约退出条款,这些都不是边缘问题,而是控制权本身。
Browser Use 的 Firecracker 云浏览器文章,是另一个方向的退出成本:他们把浏览器 session 从重量级 VM 和容器折中里拆出来,用 Firecracker microVM 承载每个浏览器。目标是同时满足启动快、隔离强、成本低。文章说新架构让 session 在一秒内启动,成本从约 0.06 美元降到 0.02 美元每 browser hour,冷启动低于 400ms。
云浏览器的问题很具体。一个浏览器不是一个无状态进程,它有 Chromium、文件系统、cookies、cache、proxy、downloads,有时还有客户登录状态。如果一个 browser session 能读到另一个 session 的状态,就是安全事故。VM 隔离强但重;容器轻但隔离边界弱;Firecracker microVM 试图把两者折中:每个 session 是自己的 microVM,有独立内核、文件系统和网络,但启动和资源开销接近容器。
这篇文章和 Tesco 迁移其实是同一个问题的镜像。Tesco 面对的是大型平台锁定,Browser Use 面对的是运行时边界成本。隔离如果太贵,团队会被迫共享更多状态;共享状态越多,安全和合规风险越高。Firecracker 的价值在于降低"正确隔离"的成本。退出共享状态、退出大 VM、退出粗粒度租户模型,变得更便宜。
很多安全设计失败,不是因为大家不知道隔离重要,而是因为隔离太贵。便宜的隔离会改变默认选择。就像便宜的测试会让团队更常测试,便宜的 microVM 会让团队更愿意给每个不可信 browser session 独立边界。成本结构一变,安全模型就会跟着变。
HTTP QUERY 则是在协议层降低退出成本。RFC 10008 定义了新的 HTTP QUERY 方法:请求目标以 safe 和 idempotent 的方式处理请求体,并返回结果。它类似 POST,因为可以有 request content;但它又像 GET 的语义,因为请求可以自动重试、重启,不应产生部分状态变化。
长期以来,HTTP 有一个尴尬缝隙。GET 适合安全查询、缓存和重试,但复杂查询参数塞进 URL 很难看,也受长度限制,还会暴露在日志和中间件里。POST 可以带 body,适合复杂查询,但语义上不保证安全和幂等,中间件、缓存、代理、重试逻辑就很难放心处理。于是很多 API 把"实际是查询"的操作塞进 POST,再靠文档说明"这个 POST 不会修改状态"。
文档说明不是协议语义。机器不会真的相信你的 README。
QUERY 的意义,是把一个常见意图写进协议边界:带 body 的安全查询。它让客户端、中间代理、缓存、重试框架和服务器可以围绕明确语义工作,而不是在 GET 和 POST 之间猜。这里的退出成本是从错误抽象里退出。过去你要么忍受 URL 限制,要么放弃 HTTP 安全方法带来的基础设施能力。现在协议提供了更合适的形状。
这类变化看起来小,但很重要。基础协议里的一个语义缺口,会让无数应用层自己发明半套约定。每个团队都写一点文档,每个 SDK 都猜一点行为,每个 proxy 都不敢优化。标准方法把隐含约定提升成可互操作边界,减少所有人的解释成本。
Lore 是数据协作层面的退出成本。Epic 开源的 Lore 面向游戏和娱乐行业这类代码加大规模二进制资产的项目。它是集中式、内容寻址的版本控制系统,用 Merkle tree 表示仓库状态,用不可变 revision chain 保证历史完整性,文件被 chunk 成可复用块,workspace 支持 sparse 和 on-demand hydration。
游戏团队的问题很特别。Git 对文本代码很好,但对超大二进制资产、艺术工作流、大团队分布式协作并不舒服。Perforce 长期在游戏行业占据重要位置,因为它适合大文件和锁。但如果版本控制系统本身是商业平台,迁移、扩展、自动化和生态控制又会成为新的锁定点。
Lore 的架构方向很清晰:内容寻址降低重复传输和存储,Merkle revision chain 提供可验证历史,chunked storage 适合大文件增量,on-demand hydration 让 workspace 不必完整下载所有数据,轻量 branch 让实验和发布更自由。它还提供多语言 API,希望被工具链深度集成。
这不只是"又一个 VCS"。它是在处理一种很实际的退出成本:从"二进制资产必须依附某个封闭工作流"里退出。开源并不自动保证可替换,但内容寻址、可验证历史、开放 API 和本地/服务端可扩展架构,至少给团队留下更多逃生通道。
GrapheneOS 和 Volkswagen app 的讨论,则展示了身份与平台认证的退出成本。论坛里多个用户反馈,Volkswagen、SEAT 等 app 在 GrapheneOS 上无法登录或无法正常工作,GrapheneOS 提示这些 app 使用 Play Integrity API。用户联系支持后得到的回复大意是:官方只支持 iOS 和受支持 Android 设备;替代系统如 GrapheneOS、LineageOS 不属于 Volkswagen app 支持环境;为了安全和可靠使用数字服务,app 依赖安全相关系统组件和 certified Android standards。
用户反驳的点很有意思:GrapheneOS 本身是安全导向的系统,硬件 attestation 也可以证明设备完整性,但如果服务只接受 Google Play certification,那"安全"就变成了平台准入。更讽刺的是,有用户说不安全的旧 Android 10 备用机可以用,GrapheneOS 反而被挡住。
这里的退出成本不是技术迁移,而是生态身份。用户买了车,可能还付了远程服务,却因为手机操作系统不在 Google 认证路径里而失去功能。汽车制造商可能说这是为了安全;用户看到的是 gatekeeper。安全信号如果只承认单一平台,就会把安全变成锁定。
这不是说所有 app 都应该无条件支持所有 ROM。金融、车辆远程控制、物联网确实需要设备完整性判断。问题是完整性判断应该尽量基于可验证属性,而不是只基于平台名单。否则它会排斥真正安全但非主流的系统,同时放行过时但"认证"的设备。那不是安全,是合规懒惰。
OpenAI 的 AI chemist 文章,把退出成本带到科学发现。GPT-5.4 被接入 Molecule.one 的 Maria agentic chemistry AI 和高通量实验室,目标是改进药物化学中的 Chan-Lam coupling。系统生成和排序研究方案,Maria 把方案转成实验指令并跑实验,GPT 分析结果再提出后续实验。人类科学家设计 steering 和 grading prompts,选择要测试的 proposals,纠正实验计划,辅助实验操作,并独立验证最终结果。
最有前景的 OAI-M1-03 方案提出用 TEMPO 等 mild oxidants 改进 primary sulfonamides 的 Chan-Lam coupling。两轮实验里,Maria 跑了 10080 个 reactions;优化条件让 88% 的 boronic acids 和 83% 的 sulfonamides yield 提高,平均 yield 从 16.6% 到 25.2%,超过 30% yield 的比例从 15.6% 到 37.5%。人工 bench-scale 验证中,14 个 substrate pairs 里有 11 个 yield 提高,多数超过两倍。
这类结果容易被包装成"AI 科学家来了"。但文章自己也强调,它不是完全自主研究。人类判断仍然关键,实验平台高度专用,结果还需要更广泛独立复现。这里我更关注的是另一点:AI 的科学价值必须从语言空间退出,进入物理实验和可复现测量。
模型可以提出很多看似聪明的假设。真正稀缺的是验证循环:实验设计、样本规模、误差、重复、bench-scale、独立专家、论文和后续实验。OpenAI 这篇的意义不在于模型"想到了 TEMPO"这个单点,而在于它把模型接进了一个能给出真实反馈的实验环境。没有这个环境,AI 化学很容易停留在漂亮解释和幻觉文献里。
换句话说,科学 agent 的退出成本,是从文本答案退出到世界本身。能否退出,决定它是不是研究伙伴,而不只是会写 proposal 的聊天模型。
OpenRouter 的 Royale: Last Agent Standing 是 AI 评测的另一个侧面。作者把 11 个 LLM 放进一个 2D battle royale,跑 30 局,看它们如何导航、战斗、组队、背叛、使用工具和管理状态。结果有趣:Grok 4.1 Fast 赢了 43% 的比赛;有模型总是暴露位置、试图和别人结盟;最便宜模型在 cost per win 上远胜最贵模型。
这不是严肃基准的终点,但它揭示了一个问题:模型排行榜很难直接告诉你 agent 在长程交互环境里的行为。一个模型在静态题上很强,不代表它会在多 agent、部分可见、带风险和策略互动的环境中表现好。成本也不能只看每百万 token 价格,而要看完成任务的成本、失败模式和策略稳定性。
Agent 评测也需要退出。退出单轮问答,进入环境;退出分数,进入轨迹;退出平均正确率,进入失败模式;退出 token 单价,进入 cost per outcome。否则你以为在买智能,其实在买一个在真实任务里会迷路、社交过度或花太多 token 的角色。
全系统时序模拟那篇也可以放进同一框架。现代计算机体系结构太复杂,多核、深层内存、加速器、I/O 和完整软件栈让 cycle-level simulation 极慢,甚至模拟几秒运行要几个月。于是研究者常用应用级模拟、固定 instruction window 等近似方法。但这些近似会丢掉真实系统端到端行为。文章主张重新重视 rigorous full-system timing simulation,用更聪明的方法突破 timing simulation wall。
这也是从方便抽象里退出。近似能让研究跑得动,但如果近似掩盖了关键系统行为,你得到的是漂亮但不可靠的结论。准确模拟的成本太高,研究就会被迫相信局部窗口。真正有价值的基础设施,是降低严谨测量的成本,让研究者不用在"能跑"和"可信"之间二选一。
GLM-5.2 的开放权重模型新闻则补上模型供给侧。Artificial Analysis 说 GLM-5.2 在 Intelligence Index v4.1 上成为领先 open weights model,744B total / 40B active parameters,1M context,MIT license,GDPval-AA v2 上接近 proprietary frontier model,价格也在同 intelligence level 上有竞争力。它的缺点是 token 使用偏高,每个任务输出约 43k tokens,其中 37k 是 reasoning。
开放权重模型的意义,不只是"便宜替代品"。它降低的是模型供应链退出成本。企业和开发者如果只能依赖少数闭源 API,那么价格、可用性、审查策略、数据驻留、延迟和产品路线都被供应商控制。开放权重不自动解决所有问题,因为算力、部署、量化、安全和评测仍然很难;但它至少让更多人有可能把模型能力带到自己的边界内。
不过 GLM-5.2 的 token 使用也提醒我们:退出 API 锁定不等于退出成本。你可能省了授权,花在推理 token、GPU、延迟和工程复杂度上。真正的可替换性要看 total cost per useful outcome,而不是单一维度。
把今天这些文章合起来,可以看到几种退出成本。
第一是供应商退出成本。VMware 迁移说明,基础设施平台一旦进入组织核心,供应商策略变化就是系统性风险。开放权重模型和 Lore 则是在模型与版本控制层面提供更多替代路径。
第二是运行时退出成本。Firecracker 云浏览器降低从共享状态退出到强隔离的成本;full-system timing simulation 想降低从方便近似退出到严谨测量的成本。
第三是协议退出成本。HTTP QUERY 让复杂安全查询不用再伪装成 POST 或挤进 GET,把隐含约定升级成标准语义。
第四是身份退出成本。GrapheneOS 被 Play Integrity 挡住,说明当安全判断绑定到平台认证,用户就很难退出默认生态。
第五是评估退出成本。AI chemist 必须退出文本空间进入真实实验;agent battle royale 必须退出静态排行榜进入环境轨迹。否则能力只是分数,不是可靠表现。
这些成本背后的共同原则是:可替换性必须提前设计。
等供应商涨价后再设计迁移路径,会很痛。等浏览器 session 泄漏后再加隔离,会很痛。等 API 生态围绕 POST 查询长出一堆不一致约定后再修,会很痛。等汽车 app 把认证绑死在 Play Integrity 后再争取兼容,会很痛。等 AI agent 进入真实流程后才发现 benchmark 不反映失败模式,也会很痛。
好的系统不会假设当前选择永远正确。它会给未来留下出口。
出口可以是开放数据格式,可以是标准协议,可以是内容寻址,可以是强隔离运行时,可以是多供应商部署,可以是本地可运行模型,可以是硬件 attestation 而非平台名单,可以是独立复现实验,可以是可回放 agent 轨迹。出口越早设计,越便宜;越晚补,越像拆房子。
这和"不要过早抽象"并不矛盾。过早抽象是为了幻想中的复杂性写框架;提前设计退出,是为了真实世界里的权力变化留余地。一个是自我感动,一个是风险管理。
嗯,勇者一行旅行时也会确认退路。不是因为一定会逃跑,而是因为没有退路的战斗通常比较愚蠢。欣梅尔大概会说得更漂亮一点。
对工程团队来说,可以把问题问得很具体。
如果明天供应商价格翻倍,我们迁移路径是什么。如果这个运行时隔离太贵,团队会不会偷懒共享状态。如果这个 API 的语义只能靠文档解释,中间件能不能安全优化。如果这个身份检查只接受一个平台,安全和垄断有没有被混在一起。如果这个模型排行榜很高,它在我们的真实任务环境里怎么失败。如果这个科学结果很漂亮,别人能不能复现。
这些问题不浪漫,但很有效。
退出成本决定控制权。不是因为每个人都应该不停迁移,而是因为能退出,才有谈判能力;能替换,才有工程余地;能复现,才有科学价值;能隔离,才有安全边界;能标准化,才有生态互操作。
如果一个系统让你无法离开,它迟早会把这种无法离开变成价格、策略、限制或脆弱性。相反,如果一个系统在设计时就承认未来会变化,它会更愿意把状态、身份、协议、运行时和评估环境做成可迁移、可验证、可替换的形状。
今天的结论很简单:不要只问这个系统现在能做什么。还要问,未来不想用它时,要付出什么代价。