作者JKGOOD (Dont QQ)
看板MIS
标题[讨论] Cloudflare 网络大爆炸事故报告
时间Wed Nov 19 23:27:45 2025
Cloudflare 网络大爆炸事故报告
故障历时 6 小时 初期误判被 DDoS 攻撃
【网络大爆炸 ... 】Cloudflare 18 日香港时间晚上 7 时 20 分起突然出现网络服务严
重故障,导致全球大量网站及网络服务完全停摆,使用 Cloudflare 的网站出现「Intern
al Server Error」,并显示为 Cloudflare 服务出错。官方今日公布事故报告,指出初
期误判为遭受 DDoS 攻击,其後才发现是人为的「低级错误」,却引发连锁性的全球网站
大崩溃。
资料显示,Cloudflare 的网络在 2025 年 11 月 18 日晚上 7 时 20 分开始出现严重故
障,就连 Downdetector 网站也 Down 了。初时,Cloudflare 观察到的症状似乎由大规
模 DDoS 攻击引起,花了不少时间排查後才发现方向完全错误,问题并非由任何形式的网
络攻击或恶意活动所致。
再深入调查後发现,Cloudflare 网络故障原因是内部人员失误,导致「资料库系统权限
变更」被误设,触发资料库向 Cloudflare 机器人管理系统使用的「特徵档案」输出大量
条目,令「特徵档案」异常庞大。这些异常的特徵档案被传播到 Cloudflare 网络中的所
有机器人,从而引发重大灾难。
这个「特徵档案」是 Cloudflare 防御网络攻击的重要文件,让 Cloudflare 机器人管理
系统能够及时更新,以应对不断变化的网络威胁。然而该系统对「特徵档案」大小设有容
量上限,结果整个 Cloudflare 网络服务因「特徵档案」异常庞大而导致系统失效。
找到问题根源後,Cloudflare 阻止了异常庞大档案的传播,并将其替换为较早版本。到
2025 年 11 月 18 日晚上 10 时 20 分,核心流量基本恢复正常;但在流量突然恢复而
负载增加的情况下,部分网站和网络服务仍一度无法运作。直至 19 日凌晨 1 时 06 分
才宣告所有系统已恢复正常运作,整个故障历时 5 小时 45 分钟。
这次故障是 Cloudflare 自 2019 年以来最严重的网络事故。Cloudflare 表示已汲取教
训,并着手建立更新、更具容错能力的系统,确保此类故障不再发生。
https://blog.cloudflare.com/18-november-2025-outage/
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 39.15.0.152 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/MIS/M.1763566068.A.A0A.html
1F:→ tomsawyer: .unwrap() 赞赞 11/30 16:58