Cloudflare 因 BYOIP 配置错误而面临 6 小时的全球中断

Cloudflare 遭受损失2026 年 2 月 20 日发生了一次长达 6 小时的严重中断。它于 UTC 时间 17:48 开始,对使用自带 IP 服务的客户造成了严重打击。 BGP 路由被错误拉取,阻止了对全球许多网站和应用程序的访问。

该问题来自例行内部更新。并非网络攻击造成的。大约 25% 的 BYOIP 前缀丢失路由。用户在 1.1.1.1 DNS 解析器等服务上看到超时和 HTTP 403 错误。

Cloudflare 的清理任务出错了。 API 调用使用了空的pending_delete 标志。服务器将其解读为“删除所有匹配的内容”。在工程师阻止之前,超过 1,100 个前缀消失了。

流量进入BGP路径搜索模式。连接循环寻找丢失的路由,直到失败。 CDN、Spectrum、Magic Transit 等核心产品都受到了打击。

受影响的服务

多个 Cloudflare 产品停止正常工作。

服务影响详情
核心CDN网站流量完全超时
光谱代理应用程序无法传递数据
专用出口出站流量受阻
神奇运输受保护的应用程序无法访问

恢复情况因客户而异。通过仪表板固定一些路线。其他人则需要完全手动恢复跨边缘机器的绑定。

时间线细目

关键事件在几个小时内展开。

  • 17:56 世界标准时间:任务运行错误,前缀撤回
  • 18:46 世界标准时间:工程师发现问题,停止进程
  • 19:19 世界标准时间:仪表板自我修复选项实时
  • 23:03 世界标准时间:完整的全局配置恢复完成

这次中断破坏了 Cloudflare 的正常运行时间承诺。它影响了全球 25% 的 BYOIP 用户。

根本原因分析

“Code Orange:Fail Small”的一个子任务旨在自动执行前缀清理。 API查询传递了pending_delete=””而不是适当的过滤器。服务器将所有匹配项排队等待删除。

与服务的绑定也被删除。随着路由从全局表中消失,BGP 搜寻随之而来。

Cloudflare 计划立即修复。它们包括 API 架构标准、BGP 删除断路器和配置快照。

官方回应

Cloudflare 的事件报告状态:“由于 API 标志为空,例行清理任务失败。”

工程师推动全球更新以恢复。仪表板切换帮助一些快速。

Cloudflare 加速变革。

  • 标准化所有 API 标志和值
  • 添加 BGP 提现速率限制
  • 生产任务之前的快照配置
  • 首先测试暂存中的清理逻辑

FAQ

是什么导致了 Cloudflare 中断?

内部 API 错误在清理期间删除了 1,100 多个 BYOIP 前缀。

持续了多久?

2 月 20 日 UTC 时间 17:48 起 6 小时 7 分钟。

哪些服务失败了?

CDN、频谱、魔术传输、专用出口。

这是网络攻击吗?

否。纯粹的配置错误,已由 Cloudflare 确认。

什么时候才能永久修复?

橙色代码升级很快就会推出并提供保障措施。