2026 年 2 月,一件令人不安的事情发生了。Wikipedia 封禁了 archive.today 的所有链接——超过 695,000 个。Cloudflare 将 archive.today 标记为"C&C/僵尸网络",通过 1.1.1.2 不再解析该域名。
archive.today 是互联网存档的重要工具,与 Wayback Machine 一起构成了抵抗网页消失的基础设施。现在,它自己成了问题的一部分。
从存档到攻击
2026 年 1 月,archive.today 在其网站中添加了代码,利用访问者作为代理对 Gyrovague 博客发起分布式拒绝服务攻击。Gyrovague 的作者是 Jani Patokallio,他批评了 archive.today 的操作者。
与此同时,archive.today 的博客发布了对 Gyrovague 的公开批评,并修改了已存档的 URL 内容。
这两个行为——DDoS 攻击和内容篡改——触犯了存档服务的基本信任假设。存档服务应该保存网页的原始状态,而不是成为攻击工具或修改存档内容。
Cloudflare 的分类
根据 Cloudflare 雷达,archive.today 当前被分类为:
- CIPA 过滤器
- 参考
- 命令与控制及僵尸网络
- DNS 隧道
"C&C/僵尸网络"这个分类意味着 Cloudflare 认为该域名被用于指挥恶意活动。对于一个互联网存档服务来说,这是毁灭性的标签。
Wikipedia 的回应
Wikipedia 编辑决定删除所有指向 archive.today 的链接。超过 695,000 个链接被移除。这个决定基于两个问题:DDoS 攻击和存档内容被篡改。
存档的核心价值在于它保存的是"那个时刻"的网页状态。如果存档可以被修改,如果存档服务可以被用于攻击,那么存档的可靠性就消失了。
平台权力的集中
Cloudflare 的标记意味着 archive.today 无法通过其 DNS 解析。对于依赖 Cloudflare 服务的用户来说,这意味着网站无法访问。
Cloudflare 控制了互联网基础设施的很大一部分——DNS、CDN、安全服务。当 Cloudflare 决定一个域名是"C&C/僵尸网络"时,这个决定有实际后果。
这里有一个问题:Cloudflare 的决定是否可申诉?是否有透明的审查流程?当存档服务被标记为恶意时,是否有机制可以纠正错误?
存档的悖论
archive.today 的坠落揭示了一个更深层的问题:互联网存档本身需要被存档。存档服务可以被攻击、被篡改、被关闭。如果存档服务本身变得不可靠,那么存档的内容就变得不可信。
Wayback Machine 也有自己的问题——它不存档所有内容,它可以被要求删除内容,它的操作者也可以做出有问题的决定。
当存档服务变得集中化,当少数几个服务控制了互联网记忆,那么这些服务的决定就决定了哪些记忆被保存、哪些被删除。
信任的链条
使用 archive.today 链接的 Wikipedia 文章现在指向一个被标记为恶意的域名。这个链接的可靠性已经受损。即使存档的内容本身没有被修改,链接的目标已经被污染。
信任链条的每一个环节都至关重要:
- 原始网页的内容
- 存档服务的诚信
- 域名解析的可靠性
- 平台基础设施的中立性
当其中一个环节断裂,整个链条的可靠性就消失了。
更广泛的含义
archive.today 的案例不是孤立的。它是互联网基础设施权力集中化的一个表现。少数几个公司——Cloudflare、Google、Amazon——控制了互联网的大部分基础设施。当这些公司做出决定时,这些决定有全球性影响。
对于存档服务来说,这意味着它们不仅依赖于技术基础设施,还依赖于这些基础设施操作者的判断。如果 Cloudflare 认为 archive.today 是恶意的,那么即使 archive.today 的辩护者认为这是错误的,结果也是一样的:网站无法访问。
记忆需要分散化
archive.today 的坠落提醒我们:互联网记忆需要分散化。依赖少数几个存档服务是危险的。当其中一个失败或被滥用时,大量记忆就消失了。
分散化的存档意味着多个独立的服务、多个备份、多个访问路径。这意味着用户应该知道如何保存网页的本地副本,如何验证存档的完整性,如何在存档服务失败时找到替代方案。
结语
archive.today 曾经是一个工具,帮助人们保存网页、抵抗审查、记录历史。现在它成了一个警示:存档服务本身也会腐败,基础设施本身也会成为武器。
在这个时代,保存互联网记忆不仅需要技术,还需要对技术背后的权力结构保持警惕。